DALL-E

Bildgenerierungsmodell von OpenAI, das aus Text-Prompts hochwertige Bilder erstellt. Eines der ersten populären Text-zu-Bild-Modelle.

DALL-E ist eine Reihe von Text-zu-Bild-Modellen des KI-Labors OpenAI, deren Name eine Mischung aus dem Künstler Salvador Dalí und dem Pixar-Roboter WALL·E ist. Mit DALL-E können Anwender aus reinem Text, sogenannten Prompts, Bilder generieren, die in Stil, Inhalt und Komposition exakt den beschriebenen Vorstellungen entsprechen sollen.

Die erste Version (DALL-E 1, 2021) basierte auf einer GPT-ähnlichen Architektur, die zweite Generation (DALL-E 2, 2022) setzte erstmals auf einen Diffusionsansatz und sorgte mit deutlich realistischeren Bildern weltweit für Aufmerksamkeit. DALL-E 3 (2023) integriert sich tief in ChatGPT, versteht komplexe Prompts besser und erzeugt insbesondere Text in Bildern zuverlässiger.

DALL-E hat den Bereich generativer Bilder im Mainstream populär gemacht und konkurriert heute mit Midjourney, Stable Diffusion und Google Imagen. Im professionellen Kontext kommt es für Marketing-Visuals, Konzeptkunst, Produktvisualisierungen und schnelle Bildideen zum Einsatz, wobei Lizenz- und Urheberrechtsfragen weiterhin diskutiert werden.

Verwandte Begriffe