Kategorie:

Veo 3 in Gemini – Kurzvideos mit Sound generieren

Auf der Google I/O dieses Jahres wurde das neue KI-Tool zur Videogenerierung, Veo 3 in Gemini, vorgestellt. Mit diesem generierst du per Prompt 8-sekündige Videos mit Ton. Allerdings nur mit einem AI-Abo.

Google Gemini Beitragsbild neu

Was ist Veo 3?

Veo 3 ist Googles KI-Tool zur Videogenerierung und direkt in Gemini verfügbar. Damit erstellst du hochwertige, 8-sekündige Videos mit Sound. Der Vorgänger, Veo 2, hat ebenfalls Videos generiert, allerdings noch ohne Sound. Das Erstellen funktioniert über einen Prompt, bei dem du beschreibst, was du dir vorstellst: Personen und Ideen, Geräusche und mehr. Alle deine Ideen werden in bewegte Bilder verwandelt.

Wie viele Clips kann ich mit Veo 3 erstellen?

Die Anzahl der Clips, die du mit Veo 3 erstellst, ist limitiert. Josh Woodward (VP, Google Labs und Google Gemini) auf X gab bekannt, dass Pro Nutzer mit Veo 3 Fast die Möglichkeit haben 3 Videos pro Tag zu generieren, bei Veo 3 (mit Ultra Abo) sind es 5 Videos pro Tag.

Sobald du dein Limit erreicht hast, wird dieses dann direkt in Gemini in der Eingabezeile angezeigt. Ebenfalls befindet sich hier dann das Datum mit Uhrzeit, an dem du wieder neue Videos erstellen kannst.

Für wen ist Veo 3 verfügbar?

Veo 3 ist im Google AI Pro-/Ultra-Abo verfügbar. Dabei wird noch zwischen Veo 3 Fast und Veo 3 unterschieden. Mit einem AI-Pro Abo erhältst du auch Zugriff auf Flow.

  • Veo 3 Fast: Erstelle jetzt Videos mit Sound – mit unserem Modell zur Videogenerierung, das dir schnell Ergebnisse liefert und gleichzeitig auf hohe Qualität ausgelegt ist. (Mit Google AI Pro-Abo (1. Monat 0 Euro, danach 21,99 Euro pro Monat), verbesserte Videoqualität, optimiert für Schnelligkeit)
  • Veo 3: Erstelle 8 Sekunden lange Videos mit Sound – mit Veo 3, unserem innovativsten Modell zur Videogenerierung. (Mit Google AI Ultra-Abo (1.-3. Monat 139,99 Euro pro Monat, später 274,99 Euro pro Monat), höchste Videoqualität) (Quelle: Google)

Was ist Flow?

Flow ist eine Plattform von Google, die für KI-gestützte Filmproduktion entwickelt wurde. Flow arbeitet mit Veo 3, Imagen und Gemini zusammen.

  • Spezialisiert auf Filmproduktion: Flow ist nicht nur ein einfaches Textfeld zur Videogenerierung. Es ist eine Oberfläche, die darauf ausgelegt ist, komplexe Videoprojekte zu verwalten, zu planen und zu erstellen.
  • Integration der besten Modelle: Flow bündelt die Stärken von Googles generativen KI-Modellen. Es nutzt:
    • Veo 3 für die Videogenerierung (mit realistischem „Fluss“ von Bewegung, Physik und Audio).
    • Imagen für realistische Bilder.
    • Gemini für die Erstellung von Dialogen und Geschichten.
  • Erweiterte Funktionen: Flow geht über die einfache Text-zu-Video-Generierung hinaus. Es bietet zum Beispiel Funktionen wie „Frames to Video“ (aus zwei Bildern eine Animation erstellen) oder „Ingredients to Video“ (aus mehreren Bildern eine Sequenz erstellen), die eine flüssigere und kontrolliertere Erzählweise ermöglichen.
  • Kreativer Workflow: Es ist ein Tool für Storyteller. Man kann eigene Assets hochladen, sie verwalten und als Referenz für die Erstellung von KI-generierten Clips verwenden.

Kurz gesagt, Veo 3 ist das Videogenerierungsmodell, während Flow die kreative Plattform oder das „Studio“ ist, das es dir ermöglicht, dieses Modell in einem umfassenderen und professionelleren Kontext zu nutzen.

Kann ich Veo 3 auch in der App nutzen?

Du kannst Veo 3 auch in der mobilen Gemini App nutzen. In der Gemini App tippst du auf die Schaltfläche „Video“ in der Prompt-Leiste, oder auf die 3 Punkte → weitere Optionen und wählst Video aus. Anschließend gibst du den Prompt ein und dein Video wird erstellt. Die Funktion ist nur mit dem Pro- oder Ultra-Abo verfügbar.

Veo 3 in Gemini
(Bildquelle: 9to5google)

Ist die Videogenerierung mit Veo 3 sicher?

Alle Videos, die mit Veo 3 generiert wurden, erhalten ein sichtbares Wasserzeichen und ein unsichtbares digitales SynthID-Wasserzeichen (entwickelt von Google DeepMind), welches kenntlich macht, dass es sich um ein mit KI generiertes Video handelt.

  • Das Wasserzeichen ist auf einer Ebene im Bild eingebettet, wo es für das menschliche Auge nicht sichtbar ist. Spezielle Algorithmen erkennen das Zeichen aber (auch nach einer Bearbeitung des Bildes) und können dazu beitragen, die Verbreitung von Deepfakes zu erschweren.

Google hat auch vor kurzem den SynthID Detector für erste Tester verfügbar gemacht. Damit lassen sich dann in Zukunft KI-generierte Inhalte, die mit Google AI erstellt wurden, schnell und einfach erkennen.

Beispielvideos von Google

Youtube Video
Youtube Video
Youtube Video

Prompt: Eine Halbtotale zeigt einen alten Seemann. Seine gestrickte blaue Matrosenmütze wirft Schatten auf seine Augen, ein dichter grauer Bart verdeckt sein Kinn. In einer Hand hält er seine Pfeife und deutet damit auf das aufgewühlte, graue Meer jenseits der Reling. „Dieser Ozean ist eine Kraft, eine wilde, ungezähmte Macht. Und er flößt einem Ehrfurcht ein, mit jedem Licht, das durchbricht.“ (Prompt Google)

Youtube Video

Prompt: Die Szene explodiert vor der rohen, instinktiven und unvorhersehbaren Energie einer Hardcore-Offroad-Rallye, eingefangen mit der Ästhetik einer dynamischen, fast Found-Footage- oder Sportdokumentation-Szene. Die Kamera wackelt oft, scheint in einem der Fahrzeuge montiert oder von einem waghalsigen Zuschauer ganz nah am Geschehen gehalten zu werden, ist häufig mit Schlamm oder Wasser bespritzt und fängt unbeabsichtigte Linsenreflexionen durch das natürliche, oft grelle Sonnenlicht ein, das durch die Bäume fällt oder von nassen Oberflächen reflektiert wird. Wir befinden uns in einer herausfordernden, ungezähmten Naturumgebung – vielleicht einem dichten, schlammigen Waldweg, einem tückischen, felsigen Abhang voller losem Geröll oder einer Reihe von flachen, schnell fließenden Flussüberquerungen. Mehrere stark modifizierte, absolut nicht identifizierbare und markenlose Geländewagen liefern sich ein frenetisches Rennen ohne Regeln. Dies sind keine Ausstellungsmodelle; es sind maßgefertigte, robuste Maschinen – Buggys mit offenen Rädern, freiliegenden Motoren und markanten Überrollkäfigen, schwer gepanzerte Pickup-Trucks mit übergroßen Stollenreifen und Schnorchelauspuffen, deren ursprüngliche Form und Hersteller durch extreme Modifikationen, Schichten von festsitzendem Schlamm und einen allgemeinen Anschein brutaler Funktionalität völlig verborgen sind. Die vorherrschenden Geräusche sind das ohrenbetäubende, kehlige Dröhnen leistungsstarker, ungezähmter Motoren, das Heulen der Getriebe, der Schlag beim Aufsetzen der Federung und die ständige Gischt von Schlamm und Wasser. Innerhalb einer 8-sekündigen Sequenz nähert sich eines der Führungsfahrzeuge, ein tiefliegender Buggy mit offenem Cockpit, der so mit dickem, braunem Schlamm verkrustet ist, dass seine ursprüngliche Farbe ein Rätsel ist, mit unglaublicher Geschwindigkeit einer breiten, flachen Flussdurchfahrt. Ohne die geringste Zögerung rast sein unsichtbarer Fahrer geradewegs ins Wasser. Durch den Aufprall wird eine enorme, fast feste, undurchsichtige Wand aus schlammigem Wasser, vermischt mit Steinen und Geröll aus dem Flussbett, spektakulär hoch in die Luft geschleudert und verschlingt den kleinen Buggy für einen schrecklichen Moment vollständig, sodass er nicht mehr zu sehen ist, als wäre er vom Fluss selbst verschluckt worden. Dicht auf den Fersen ist ihm ein ebenso schlammverkrusteter Spezial-Truck – ein bulliges Biest mit hoher Bodenfreiheit, stark verstärktem Überrollkäfig und ohne erkennbare Markenbezeichnung –, der die Flussüberquerung gerade erreicht, als die gewaltige Wand aus Wasser ihren Höhepunkt erreicht. Anstatt abzubremsen oder zu versuchen, einen besseren Weg zu finden, stürzt sich der Fahrer des Trucks mit unerschütterlicher Aggressivität und Vollgas direkt in diesen undurchsichtigen, turbulenten Vorhang aus schlammiger Gischt und hindurch. Einen Sekundenbruchteil später bricht der Lastwagen auf der anderen Seite der Flut hervor, Wasser strömt von Dach und Fahrgestell, die übergroßen Scheibenwischer kämpfen verzweifelt, um den Schlammschwall zu beseitigen, der dem Fahrer die Sicht raubt. Er landet schwerfällig am anderen Ufer, die Federung ächzt, aber er verfolgt immer noch den wieder auftauchenden Buggy. Dieses aufregende, chaotische, diie visuell spektakuläre Sequenz, in der ein Fahrzeug ein massives Hindernis in der Umgebung erzeugt und das nächste es sofort mit purer Kraft überwindet, bildet das zentrale, fesselnde und die Aufmerksamkeit erregende Ereignis der 8-sekündigen Sequenz. Das Rennen geht mit unverminderter Wildheit weiter, und das natürliche Gelände selbst ist ein aktiver Teilnehmer des Konflikts. (Prompt Google)

Effektive Prompts für das Erstellen eines Clips

Im Falle von Veo 3 ist der Prompt quasi das Drehbuch für deinen Clip. Mit der Eingabe beschreibst du den Inhalt des 8-sekündigen Clips. Je detaillierter deine Beschreibung/dein Prompt ist, desto besser wird dein Ergebnis. Folgende Inhalte sollte dein Prompt enthalten:

  1. Hauptcharakter: Beschreibe deinen Hauptcharakter, indem du zum Beispiel nicht nur eingibst: „Ein Hund“, sondern „Ein flauschiger Golden Retriever mit Sonnenbrille und Smoking“ Je mehr Details, desto besser.
  2. Ort/Handlung: Beschreibe den Ort und die Handlung, zum Beispiel: „ein tropischer Stand mit sich im Wind wogenden Palmen“, „ein gemütliches Haus am. Ufer eines Sees, die Sonne geht unter und taucht den See in ein goldgelbes Licht“.
  3. Was passiert im Clip?: Beschreibe, was dein Hauptcharakter tut. Flieht er vor einem „riesigen Felsbrocken“, „tanzt er mit einer lachenden Schildkröte durch das Abendrot“ uvm.
  4. Stimmung & Stil: Damit gibst du den Stil deines Clips an, zum Beispiel „Anime-Stil“, „VHS-Video der 80er“ und auch die Stimmung wählst du aus von „Drama/dramatisch“, „spannend“, „chaotisch“.
  5. Die Kraft des Klangs: Die Superkraft von Veo 3! Füge Soundeffekte in dein Video via Prompt: „hupende Autos“ oder „fröhliches Vogelgezwitscher“ hinzu. Gib auch Anweisungen für Dialoge, indem du deinen Charakter „nervös flüstern“ oder „wütend schreien“ lässt.

Weitere Regie-Tipps

Weitere Tipps, die deinen Prompt aufwerten:

Kamerabewegungen

  • Nahaufnahme: Fordert z.B. eine „Nahaufnahme der Augen einer Person“ an.
  • Luftaufnahme: Beschreibt z.B. eine „Luftaufnahme eines Waldes bei Einbruch der Dunkelheit“.
  • Zoom: Nutzt z.B. einen „langsamen Zoom von einer Weitwinkelaufnahme auf den Mund einer Person“.
  • Dolly-Fahrt (Dolly): Eine Bewegung der gesamten Kamera vorwärts oder rückwärts auf Schienen.
  • Schwenk (Pan): Eine horizontale Bewegung der Kamera auf einer festen Achse.

Kameraperspektiven

  • Froschperspektive (Low-Angle Shot): Lässt euer Motiv größer und mächtiger erscheinen.
  • Vogelperspektive (High-Angle Shot): Lässt euer Motiv kleiner und verletzlicher wirken.
  • Point-of-view (POV): Zeigt die Szene aus der Perspektive einer Figur.

Fokus und Licht

  • Geringe Schärfentiefe (Shallow Depth of Field): Isoliert euer Hauptmotiv, indem nur ein kleiner Teil des Bildes scharf ist.
  • Low-Key-Beleuchtung: Schafft eine dunkle, dramatische Atmosphäre mit starken Schatten.
  • Farbkorrektur (Color Grading): Bittet um eine bestimmte Farbgebung, wie zum Beispiel „warme Farbtöne wie Rot, Orange und Gelb“, um ein Gefühl von Wärme zu erzeugen.

Stil und Genre

  • Filmisch / Cineastisch: Ein Stil, der das Aussehen und die Anmutung von Spielfilmen nachahmt.
  • Dokumentarisch: Ein Stil, der Realismus und Authentizität betont.
  • Vlog-Stil: Ein Stil, der informell und gesprächig ist.
  • Abstrakt: Nicht-gegenständlicher visueller Stil.
  • Surreal: Traumhafter oder bizarrer visueller Stil.
  • Minimalistisch: Einfacher und aufgeräumter visueller Stil.
  • Retro: Ein Stil, der eine vergangene Ära nachahmt.
  • Bewegter Zeitraffer / Hyperlapse: Eine Zeitraffertechnik mit einer sich bewegenden Kamera.
  • Zeitlupe: Filmmaterial, das mit reduzierter Geschwindigkeit abgespielt wird.
  • Zeitraffer: Filmmaterial, das aus Bildern besteht, die mit einer sehr niedrigen Bildrate aufgenommen wurden.

Fazit

Mit dem Videogenerator Veo 3 lassen sich, mit dem richtigen Prompt, witzige und teils sehr echt wirkende 8-sekündige Videos mit Ton erstellen. Allerdings hast du nur Zugriff auf das Tool, wenn du Googles AI Pro- oder Ultra-Abo abschließt. Und auch dann gibt es derzeit noch ein Limit auf 3 bzw. 5 Videos pro Tag.


Navigation:

Veröffentlicht von: