Veo

Videogenerierungs-Modell von Google DeepMind, das hochauflösende Videos aus Text- oder Bild-Prompts erstellt.

Veo ist die Text- und Bild-zu-Video-Modellfamilie von Google DeepMind und das zentrale Gegenstück zu OpenAIs Sora. Erstmals 2024 vorgestellt, ist Veo inzwischen in mehreren Generationen verfügbar (Veo 2, Veo 3) und erzeugt hochauflösende Videoclips bis hin zu 4K und mehreren Minuten Länge.

Charakteristisch ist die hohe filmische Qualität: Veo versteht Kamerabewegungen ("Slow Pan", "Dolly Zoom"), Lichtstimmungen, Schnittfolgen und Stile, die direkt im Prompt beschrieben werden. Veo 3 ergänzt die Videogenerierung zusätzlich um synchron erzeugte Tonspuren mit Stimmen, Musik und Effekten als wichtigen Schritt hin zu vollwertigen generierten Filmen.

Veo wird über die Gemini-App, Vertex AI und das spezialisierte Tool Google Flow angeboten und konkurriert mit Sora, Runway, Luma Dream Machine und Kling. Im professionellen Umfeld kommt Veo unter anderem in Werbung, Pre-Production, Mood-Boards und automatisierter Content-Erstellung zum Einsatz.

Verwandte Begriffe