
Zugegeben, die meisten von Künstlicher Intelligenz generierten Videos sind noch recht simpel gestrickt und sehen künstlich aus, doch sie verbessern sich kontinuierlich. Man sollte die Videowerkzeuge der KI auf jeden Fall genauer anschauen, denn sie können einem viel Arbeitszeit ersparen und eröffnen visuelle Effekte und Erzählmöglichkeiten, die bis vor Kurzem nur mit sehr hohen Budgets möglich waren. Oder man sieht sich in seinen klassischen von Menschenhand gestalteten VFX (Visual Effects) und sonstigen manuellen Videoarbeiten bestätigt.
Wo die KI generierten Videos noch schwächeln, ist die Auflösung. HD ist inzwischen machbar, bei 4 K wird es häufig sehr schwierig bis unmöglich. Und nach wie vor hapert es oft an de Konsistenz. Filmleute wollen Szenen überarbeiten und optimieren, doch die KI wirft auch gerne bei jedem Überarbeitungsschritt wieder ein neues Ergebnis aus. Oder die generierten Figuren haben in jeder Einstellung einen anderen Hemdkragen oder eine andere Nase. Die fehlende Wiederholbarkeit macht professionellen Anwendern aktuell noch die größten Probleme. Wenn es sich aber um einzelne Shots handelt, die als VFX viel Geld und Zeit gefordert hätten, kommt KI bereits in zahlreichen Serien und Einzelfilmen zum Einsatz.
Abgesehen davon sind so viele rechtliche Fragen bei der Nutzung von KI bei der Videogenerierung ungeklärt. Bis auf Abobe garantiert kein Anbieter, dass er auch im Besitz der Rechte an dem generierten Material ist. Und wer weiß, ob die Anbieter nicht in allzu naher Zukunft für die gewerbliche Nutzung von KI-generierten Videos Lizenzgebühren verlangen werden? So gut wie alle KI Anbieter sind Stand 2025 nicht in der Lage, damit Gewinne zu erwirtschaften.
Vorgehensweise
Nun, wer bereits viel mit Bildgenrierung per KI gearbeitet hat, wird wissen, wie wichtig die möglichst genaue Formulierung der Prompts ist. Einerseits um das gewünschte Ergebnis zu erhalten, andererseits um die vielen Halluzinationen der KI einzufangen. Bei Videosequenzen ist das noch viel wichtiger und so kann so ein Prompt für das gewünschte Video auch gerne mal eine halbe Seite Text beinhalten und viele Iterationsschleifen benötigen bis man zu einem annehmbaren Ergebnis kommt. Dabei muss die sehr genau beschrieben werden was in der gewünschten Einstellung zu sehen sein soll, was geschehen, wie es aussehen, wie der Vordergrund, wie der Hintergrund gestaltet ist und vieles mehr. Also im Grunde genommen eine möglichst ausführliche und genaue Bildbeschreibung inklusive der Handlungsabläufe. Die Prompts ändern sich teilweise auch mit dem Aufkommen neuer KI Versionen, man muss da kontinuierlich anpassen. Zusätzlich muss auch die Tonebene beschrieben werden, falls das Progamm diese ebenfalls generieren kann.
Wie schon bei der Fotobearbeitung mit KI, so kann man auch bei Videos eigene Elemente mit generierten mischen. Im einfachsten Fall lädt man ein Referenzfoto in die KI um den Stil und andere Vorgaben schon mal visuell vorzulegen. So ist es beispielsweise möglich, aus einem starren Foto eine bewegte Einstellung generieren zu lassen, dabei wird dann das starre Bild der erste Frame einer generierten Sequenz. Eine Person oder ein Tier auf einem Foto kann so zum Leben erweckt werden, kann sich umschauen, kann sich drehen, bewegen, gehen.
Wichtige Befehle / Prompts
- First-Last-Frame: Ermöglicht die genaue Kontrolle von Anfangs- und Endbild der bearbeiteten Sequenz
- Expand: Verlängert eine Einstellung nahtlos
- Reframe: Passt das Videoformat automatisch an verschiedene Größen / Höhen-Seitenverhältnisse wie 16:9 oder 9:16 an
- LipSync: Synchronisiert Mundbewegungen des Videos mit Sprache oder Gesang
- Restyle: Ändert an Hand eines Referenzbildes, welches man hochlädt, den Look des zu bearbeitenden Videos
Avatare
Man kann der KI ein Video von einer Person als Grundlage geben um ein neues Video der Person zu generieren. Dafür sind nur wenige Minuten Originalvideo notwendig. Man kennt das auch under dem Namen Deep Fake Videos. Mit dieser Avatar-Funktion ist es künftig möglich, dass man eine Person in allen möglichen Sprachen der Welt kommunizieren lässt, dass Influencer ihre Videos in allen Weltsprachen veröffentlichen können und vieles mehr. Noch sehen diese Videos etwas seltsam aus, ein wenig wie Satelitenübertragungen, bei denen viele Details herauskomprimiert wurden. Da sind die vielfältigen Muskelbewegungen des Menschen in seiner Gesichtsmimik doch deutlich reduziert, aber wer weiß, wie lange es dauert, bis das auch von der KI besser imitiert werden kann. Doch die Schauspielergewerkschaften und Vereinigungen sind längst alarmiert und protestieren gegen allzu freien Umgang mit den KI-Generatoren.
Die Texte, welche die Avatare sprechen sollen kann man entweder selbst einsprechen oder lediglich schreiben und mit einem Text-zu-Sprache Tool umsetzen lassen. Die Lippenbewegungen des Avatars werden dann an den Text angepasst. In primitiver Form kann das bereits Adobe Express in seiner kostenlosen Version. Und die neueste Version von Googles Gemini kann extrem gute Übersetzungen mit der ursprünglichen Stimme erzeugen und das sogar in Echtzeit.
Text zu Sprache Tools
- Artlist
- Eleven Labs
- Speechify
- VoxDo
- Murf.ai
- Play.ht
- Lovo.ai
- Uberduck.ai
- NaturalReaders
- Balabolka
- Amazon Polly
- Google Text-to-Speech
- Vidnoz
Dauer
Die Länge der Videos ist je nach Programm auf eine bestimmte Dauer begrenzt, aber bis zu 16 Sekunden sind aktuell möglich. Und wenn einem das nicht reicht, kann man auch das letzte Filmbild des generierten Videos als Standbild speichern und die KI damit beauftragen daraus wieder eine weitere Sequenz zu genereieren. So kann man die Länge ausdehnen. Oft hat die Begrenzung auch mit der Kostenstruktur zu tun. Kostenlose Versionen sind oft in der Auflösung und der Dauer begrenzt, in den kostenpflichtigen Versionen geht dann zumeist mehr. Trotzdem haben viele KI generierte Filme jeweils nur sehr kurze Einstellungen.
Programme
- Runway Gen2 (kostenlos)
- Midjourney
- Leonardo ai (kostenlos),
- One Way Jam 2
- Pika Labs
- Heygen (Deep Fakes, Avatare)
- D-ID
- Cap Cut
- Leia Pix
- Kaiber (Für Animationen)
- Genmo
- Instaverse (2 D Bilder zu 3 D umwandeln und sich darin bewegen)
- Movie Gen AI
Hier ein Video, welches in Kurzform einige Möglichkeiten aufzeigt.

