Definition Was ist DALL-E?

Aktualisiert am 25.02.2025 Von Dipl.-Ing. (FH) Stefan Luber 4 min Lesedauer

Anbieter zum Thema

DALL-E ist ein von OpenAI entwickeltes KI-Modell. Es gehört zur Kategorie generativer KI (Generative AI), das aus natürlichsprachigen Texteingaben beeindruckende Bilder generieren kann. Die Technologie nutzt neuronale Netzwerke, um kreative und fotorealistische Darstellungen zu erschaffen. Seit der Integration in ChatGPT ist DALL-E für eine breite Nutzerschaft zugänglich und eröffnet neue kreative Möglichkeiten für Künstler, Designer und Technikbegeisterte.

DALL-E ist ein KI-Modell von OpenAI, das Bilder aus Texteingaben generiert und so Kunst und Technologie vereint.(Bild:  KI-generiert)
DALL-E ist ein KI-Modell von OpenAI, das Bilder aus Texteingaben generiert und so Kunst und Technologie vereint.
(Bild: KI-generiert)

DALL-E ist der Name einer Künstlichen Intelligenz des Unternehmens OpenAI aus der Kategorie Generative AI (generative Künstliche Intelligenz). Es handelt sich um einen Text-zu-Bild-Generator, der auf Basis einer Textanweisung in natürlicher Sprache ein digitales Bild erstellt. Der Name DALL-E setzt sich aus den Namen des Künstlers Salvador Dalí und des Roboters WALL-E aus dem Animations-Kinofilm der Pixar Animation Studios „WALL-E – Der Letzte räumt die Erde auf“ zusammen.

Entwicklungen und Versionen von DALL-E

DALL-E (Januar 2021): Die erste Version wurde im Jahr 2021 vorgestellt und sorgte aufgrund der beeindruckenden Fähigkeiten der Künstlichen Intelligenz für großes Aufsehen. DALL-E konnte bereits fotorealistische Bilder, Zeichnungen und Gemälde in verschiedenen künstlerischen Stilrichtungen und einiges mehr erstellen oder variieren. Der Text-zu-Bild-Generator basierte auf dem ebenfalls von OpenAI entwickelten Textgenerator Generative Pretrained Transformer 3 (GPT-3) und war über eine Weboberfläche prinzipiell von jedem nutzbar.

DALL-E (April 2022): Im Jahr 2022 erschien eine verbesserte Version von DALL-E, die ein Diffusionsmodell mit der Bezeichnung GLIDE nutzte und das auf CLIP-Einbettungen (Contrastive Language-Image Pretraining) konditioniert war. Damit waren noch realistischere und höher aufgelöste Bilder möglich. Zu den besonderen Fähigkeiten dieser Version zählen zum Beispiel eine schnellere Bildverarbeitung, realistischere Lichtreflexionen und Lichtverhältnisse, komplexere Hintergründe, die Funktion des Inpaintings (Editieren eines spezifischen Bildbereichs), das Erstellen verschiedener Bildvariationen in unterschiedlichen Stilrichtungen oder das Hinzufügen und Kombinieren mehrerer Bilder.

DALL-E (Oktober 2023): Mit DALL-E 3 wurde die Bildqualität weiter optimiert. Zudem wurde das Modell enger in ChatGPT integriert, sodass Benutzer noch präzisere Bilder aus Texteingaben generieren können. Neben einer verbesserten Auflösung und Detailgenauigkeit wurde auch die Interpretation komplexer Anfragen deutlich verbessert. Zudem können Nutzer durch erweiterte Steuerungsmöglichkeiten, wie Stil- und Kompositionsvorgaben, gezieltere Ergebnisse erzielen. Ein weiteres Highlight ist die Möglichkeit, bestehende Bilder durch gezielte Anweisungen zu modifizieren oder fortzuführen.

DALL-E (Stand 2025): Seit der Veröffentlichung von DALL-E 3 ist die Technologie in ChatGPT eingebettet, sodass Nutzer Bilder direkt über Textanfragen erstellen können. Während das Modell zunächst nur für ChatGPT-Plus- und Enterprise-Nutzer verfügbar war, wurde es im August 2024 auch für Nutzer ohne Kosten freigegeben, allerdings mit einem Limit von zwei Bildern pro Tag. Microsoft hat DALL-E 3 zudem in seinen Bing Image Creator integriert, um die Bildgenerierung für eine breitere Nutzerbasis zugänglich zu machen. Ein Qualitätsproblem führte jedoch Anfang 2025 zu einem vorübergehenden Downgrade der Bildgenerierungsmodelle.

Abgeleitet von DALL-E existiert eine ursprünglich als DALL-E mini und heute als Craiyon benannte Version des Text-zu-Bild-Generators. Sie basiert auf dem Quellcode von DALL-E, ist aber weniger leistungsfähig. Neben DALL-E gibt es mittlerweile zahlreiche weitere KI-Text-zu-Bild-Generatoren wie Stable Diffusion oder Midjourney. Diese alternativen Modelle bieten unterschiedliche Ansätze in der Bildgenerierung und ermöglichen durch Open-Source-Communitys oder spezifische Algorithmen variierende Ergebnisse.

Nutzung von DALL-E

DALL-E ist seit der Veröffentlichung der Version 3 in ChatGPT integriert und war zunächst exklusive für ChatGPT-Plus- und Enterprise-Nutzer verfügbar. Seit August 2023 kann jeder mit einem OpenAI-Account die Bildgenerierung auch kostenlos nutzen, allerdings mit einer Einschränkung: Pro Tag können zwei Bilder generiert werden.

Nutzer können über einen Prompt (Befehlszeile) in ChatGPT die Bildbeschreibung für ein zu erstellende Bild eingeben. Bei der Nutzung der Befehlszeile ist das Ergebnis wesentlich von der detaillierten textlichen Beschreibung des gewünschten Bildes abhängig. Es lassen sich Motive, Hintergründe, Umgebungen, Stilrichtungen, Stimmungen und vieles mehr beschreiben.

Je besser bzw. ausführlicher der Prompt also ist, desto besser wird das Ergebnis sein. Es gibt im Internet zahlreiche Tools, die dabei helfen, den passenden Prompt zu generieren. Zu den bekanntesten zählen PromptHero, das eine Sammlung von Beispiel-Prompts bietet, Lexica, das durch eine Bildersuche inspiriert, und natürlich auch der ChatGPT Prompt Generator selbst, der auf KI basiert und passende Prompts für unterschiedliche Anforderungen vorschlägt. Auch spezialisierte Plattformen wie PromptPerfect und AI Prompt Guide bieten Hilfestellung zur Formulierung detaillierter und optimierter Prompts, um eine höhere Bildqualität und zielgerichtete Ergebnisse zu erzielen.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Big Data, Analytics & AI

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Herausforderungen und ethische Fragen von DALL-E

Trotz der technologischen Fortschritte gibt es weiterhin Herausforderungen: Eine der größten Sorgen ist die Verbreitung von Desinformation und Deepfakes durch die Erstellung täuschend echter Bilder, die manipulierte oder gefälschte Darstellungen enthalten können. Besonders in sozialen Medien oder Nachrichtenkontexten kann dies zu einer schnellen Verbreitung von Fehlinformationen führen, wodurch die Glaubwürdigkeit von Bildmaterial insgesamt infrage gestellt wird.

Zudem stehen Urheberrechtsfragen im Raum, da viele Künstler befürchten, dass KI-generierte Bilder ihre Arbeit ersetzen oder gar auf ihren eigenen Werken basieren könnten, ohne dass sie dafür eine Anerkennung oder Vergütung erhalten.

Ein weiteres Problem sind mögliche Verzerrungen und Vorurteile in der Bildgenerierung. Wie bei vielen KI-Modellen kann auch DALL-E bestehende kulturelle Stereotypen verstärken oder ungenaue, voreingenommene Darstellungen produzieren. Dies führt zu der Frage, wie Entwickler und Nutzer sicherstellen können, dass die Technologie fair und unvoreingenommen bleibt. Eine transparente Kontrolle der Trainingsdaten und klare Richtlinien für die Nutzung sind essenziell, um diese Herausforderungen zu minimieren.

(ID:49438840)