DALL-E ist Geschichte: OpenAI stellt seine Bildmodelle am 12. Mai ein

OpenAI schaltet sowohl DALL-E 2 als auch DALL-E 3 am 12. Mai 2026 ab. Zusammen mit der Abschaltung von Sora im März markiert dies das Ende zweier der bekanntesten kreativen KI-Produkte von OpenAI. Die Nachfolger stehen bereits bereit — und sie unterscheiden sich grundlegend von ihren Vorgängern.

Am 12. Mai 2026 zieht OpenAI bei DALL-E den Stecker. Sowohl DALL-E 2 als auch DALL-E 3 — die Bildgenerierungsmodelle, die Millionen von Menschen mit KI-generierter Kunst vertraut gemacht haben — werden keine API-Anfragen mehr beantworten. Die Endpunkte werden Fehlermeldungen zurückgeben. Die Modelle verstummen.

Das kommt nicht überraschend. OpenAI hat diesen Schritt seit Monaten angekündigt. ChatGPT-Nutzer wurden bereits im Dezember 2025 automatisch von DALL-E 3 auf GPT Image 1.5 umgestellt. Die API-Abkündigungsmitteilung ging Anfang 2026 heraus. Aber das konkrete Abschaltdatum — der 12. Mai — macht es auf eine Weise real, die eine bloße Abkündigungsmitteilung nicht vermag.

Was diesen Moment bedeutsam macht, ist nicht nur die Einstellung eines beliebten Produkts. Es ist das Muster, das sich dahinter abzeichnet. Im März 2026 stellte OpenAI Sora ein, sein Text-zu-Video-Modell. Nun folgt DALL-E. Zwei der bekanntesten kreativen KI-Tools von OpenAI — innerhalb von zwei Monaten verschwunden.

Die Nachfolger erzählen eine Geschichte darüber, wohin sich die KI-Bildgenerierung entwickelt. Statt eigenständiger Einzelzweck-Modelle setzt OpenAI auf Bildgenerierung, die direkt in seine großen Sprachmodelle integriert ist. GPT Image 1.5 ist bereits verfügbar. GPT-Image-2 steht unmittelbar bevor. Die Architektur hat sich grundlegend verändert.

Dieser Artikel behandelt alles, was Sie wissen müssen: den vollständigen Zeitplan von DALL-Es Aufstieg und Ende, was genau eingestellt wird, was es ersetzt, wie sich die Nachfolger im Vergleich schlagen und was Entwickler und Unternehmen vor dem 12. Mai tun müssen.

Der Zeitplan: DALL-Es Weg vom Durchbruch zur Einstellung

DALL-E hatte einen der komprimiertesten Produktlebenszyklen in der Geschichte der KI. Vom ersten Forschungspapier bis zur vollständigen Einstellung in etwas mehr als fünf Jahren.

Januar 2021: DALL-E (Original)

OpenAI veröffentlichte einen Forschungsblog, der DALL-E vorstellte — eine Version von GPT-3 mit 12 Milliarden Parametern, die darauf trainiert wurde, Bilder aus Textbeschreibungen zu generieren. Es war eine Forschungsvorschau, kein Produkt. Kein öffentlicher Zugang. Aber das Konzept — einen Satz eingeben, ein Bild erhalten — faszinierte die gesamte Technologiewelt. Der Name, eine Verschmelzung von Salvador Dali und WALL-E, wurde sofort zur Ikone.

Das ursprüngliche DALL-E konnte Bilder aus Prompts wie „ein Sessel in Form einer Avocado" oder „eine professionelle, hochwertige Illustration eines Baby-Daikon-Rettichs im Tutu, der einen Hund ausführt" generieren. Die Ergebnisse waren nach heutigen Maßstäben grob, aber 2021 wirkten sie wie Science-Fiction.

April 2022: DALL-E 2

DALL-E 2 war die Version, die alles veränderte. OpenAI veröffentlichte es mit einem Wartelistensystem, das eine enorme Nachfrage erzeugte. Das Modell nutzte eine Diffusions-basierte Architektur (eine deutliche Abkehr vom diskreten VAE-Ansatz des Originals) und produzierte drastisch höherwertige Bilder in höherer Auflösung.

DALL-E 2 führte zentrale Funktionen ein: Inpainting (Bearbeitung bestimmter Bildbereiche), Outpainting (Erweiterung von Bildern über ihre ursprünglichen Grenzen hinaus) und Variationen (Generierung ähnlicher Bilder basierend auf einer hochgeladenen Vorlage). Es entwickelte sich von einer Forschungskuriosität zum Mainstream-Produkt. Künstler, Designer, Marketer und Hobbyisten strömten auf die Plattform.

Die API wurde später 2022 eingeführt und ermöglichte es Entwicklern, DALL-E 2 in ihre eigenen Anwendungen zu integrieren. Dies war der Beginn von DALL-E als Infrastruktur — nicht nur ein Verbraucherspielzeug, sondern ein Baustein für andere Produkte.

Oktober 2023: DALL-E 3

DALL-E 3 wurde direkt in ChatGPT integriert — ein Schritt, der die Richtung vorwegnahm, die OpenAI letztlich einschlagen würde. Statt eine separate Oberfläche aufrufen zu müssen, konnte DALL-E 3 Bilder mitten im Gespräch generieren. ChatGPT bitten, ein Konzept zu erklären, und es dann illustrieren lassen — alles im selben Thread.

Die Modellqualität machte einen deutlichen Sprung. DALL-E 3 war wesentlich besser darin, komplexe Prompts zu befolgen, Text in Bildern darzustellen (immer noch nicht perfekt, aber dramatisch verbessert) und kohärente Kompositionen mit mehreren Motiven zu erzeugen. Es wurde außerdem mit einem integrierten Sicherheitssystem eingeführt, das mit ChatGPTs Moderationsschicht entwickelt wurde.

Entscheidend war, dass DALL-E 3 auch über die API verfügbar gemacht wurde und Abwärtskompatibilität beibehielt, während es ein wesentlich leistungsfähigeres Modell bot.

2025: GPT-4o-Bildgenerierung und der Anfang vom Ende

Die Zeichen standen an der Wand, als OpenAI native Bildgenerierungsfähigkeiten in GPT-4o einführte. Statt ein separates DALL-E-Modell aufzurufen, konnte GPT-4o Bilder als Teil seiner eigenen multimodalen Ausgabe generieren. Dies war kein Wrapper um DALL-E — es war eine grundlegend andere Architektur, bei der Bildgenerierung eine native Fähigkeit des Sprachmodells selbst war.

Die Qualität war mit DALL-E 3 vergleichbar, und die Nutzererfahrung war überlegen. Kein Moduswechsel, kein separater Modellaufruf. Einfach eine Konversation, die fließend Text, Code und Bilder produzieren konnte.

Dezember 2025: GPT Image 1.5 ersetzt DALL-E 3 in ChatGPT

Im Dezember 2025 ersetzte OpenAI DALL-E 3 still und leise durch GPT Image 1.5 als Standard-Bildgenerierungsmodell in ChatGPT. Nutzer, die DALL-E 3 über ChatGPT verwendet hatten, wurden automatisch migriert. Für die meisten Gelegenheitsnutzer verlief der Übergang nahtlos — sie bemerkten lediglich, dass die Bildgenerierung schneller wurde und besser auf den Gesprächskontext reagierte.

Dies war das deutlichste Signal, dass DALL-Es Tage gezählt waren. OpenAI hatte sein Flaggschiff-Verbraucherprodukt bereits von dem Modell abgekoppelt.

Anfang 2026: Offizielle Abkündigung

OpenAI gab offiziell bekannt, dass sowohl die DALL-E 2- als auch die DALL-E 3-APIs eingestellt werden, mit dem 12. Mai 2026 als Abschaltdatum. Die Ankündigung gab API-Nutzern ungefähr vier Monate Zeit, ihre Integrationen auf die neuen GPT-Image-Endpunkte umzustellen.

März 2026: Sora wird eingestellt

Noch bevor DALL-E sein Abschaltdatum erreicht, stellte OpenAI Sora ein, sein Text-zu-Video-Generierungsmodell. Die offizielle Begründung verwies auf eine Neuausrichtung der Ressourcen, aber das Muster war klar: OpenAI zog sich von eigenständigen kreativen KI-Tools zurück und setzte stattdessen auf integrierte Fähigkeiten innerhalb seiner Kern-LLM-Produkte.

12. Mai 2026: DALL-E verstummt

Der Endpunkt antwortet nicht mehr. Fünf Jahre und vier Monate nach dem ursprünglichen DALL-E-Blogbeitrag ist die Produktlinie vollständig eingestellt.

Was genau am 12. Mai eingestellt wird

Lassen Sie uns konkret benennen, was aufhört zu funktionieren und was nicht.

Was abgeschaltet wird

DALL-E 2 API — Der dall-e-2-Modellendpunkt nimmt keine Anfragen mehr an. Jede Anwendung, die POST /v1/images/generations mit "model": "dall-e-2" aufruft, erhält eine Fehlermeldung.
DALL-E 3 API — Der dall-e-3-Modellendpunkt nimmt keine Anfragen mehr an. Gleiches gilt hier: Jeder API-Aufruf, der DALL-E 3 als Modell angibt, wird fehlschlagen.
DALL-E-Bildbearbeitungsendpunkte — Der /v1/images/edits-Endpunkt (Inpainting), der auf DALL-E 2 basierte, wird nicht mehr funktionieren.
DALL-E-Variationen-Endpunkt — Der /v1/images/variations-Endpunkt wird ebenfalls eingestellt.
Azure-OpenAI-DALL-E-Bereitstellungen — Azure-Kunden, die DALL-E 2 oder DALL-E 3 über den Azure OpenAI Service bereitgestellt haben, sind ebenfalls betroffen. Microsoft hat eigene Migrationsleitfäden veröffentlicht, die auf den 12. Mai abgestimmt sind.

Was NICHT betroffen ist

ChatGPT-Bildgenerierung — ChatGPT hat bereits im Dezember 2025 auf GPT Image 1.5 umgestellt. Wenn Sie Bilder über ChatGPT (Web, Mobil oder Desktop-App) generieren, ändert sich für Sie am 12. Mai nichts.
Bereits generierte Bilder — Bilder, die Sie bereits mit DALL-E erstellt haben, gehören Ihnen. Sie verschwinden nicht. Aber die Möglichkeit, neue Bilder über die DALL-E-Endpunkte zu generieren, endet.
GPT-Image-API-Endpunkte — Die neueren Bildgenerierungsendpunkte, die GPT Image 1.5 (und bald GPT-Image-2) nutzen, funktionieren weiterhin normal.

Auswirkungen auf bestehende Integrationen

Hier trifft die eigentliche Disruption. Jede Anwendung, jeder Dienst und jeder Workflow, der direkte API-Aufrufe an DALL-E 2 oder DALL-E 3 macht, wird am 12. Mai nicht mehr funktionieren, sofern nicht migriert wird. Dazu gehören:

SaaS-Produkte, die KI-Bildgenerierung auf Basis von DALL-E anbieten
Marketing-Automatisierungstools mit DALL-E-Integrationen
Design-Tools und Figma/Canva-Plugins, die die DALL-E-API aufrufen
Individuelle interne Tools, die auf den DALL-E-Endpunkten aufbauen
No-Code/Low-Code-Workflows (Zapier, Make etc.), die auf DALL-E-Modellnamen verweisen
Mobile Apps, die das OpenAI SDK mit DALL-E-Modellspezifikationen verwenden

Wenn Sie eines davon betreuen, ist der 12. Mai eine harte Deadline.

Was DALL-E ersetzt: Der Wechsel zur multimodalen, in LLMs integrierten Generierung

Die Einstellung von DALL-E ist nicht nur ein Produkttausch. Sie steht für eine grundlegende architektonische Verschiebung in OpenAIs Herangehensweise an die Bildgenerierung. Das alte Modell: ein spezialisiertes Bildgenerierungssystem, das einen Textprompt empfängt und ein Bild zurückgibt. Das neue Modell: ein multimodales LLM, das Bilder als eine seiner nativen Ausgabemodalitäten generieren kann, mit vollem Bewusstsein für den Gesprächskontext.

GPT Image 1.5: Der aktuelle Standard

GPT Image 1.5 ist seit Dezember 2025 das Standard-Bildgenerierungsmodell in ChatGPT. Es ist auch über die API verfügbar. Das zeichnet es aus:

Kontextbewusste Generierung. Anders als DALL-E, das jeden Prompt als isolierte Anfrage behandelte, versteht GPT Image 1.5 den gesamten Gesprächskontext. Wenn Sie über 10 Nachrichten hinweg Markenrichtlinien besprochen haben, spiegelt das generierte Bild das gesamte Gespräch wider — nicht nur den letzten Prompt.
Iterative Verfeinerung. Sie können sagen „Mach den Hintergrund dunkler" oder „Verschieb den Text nach links", und GPT Image 1.5 versteht, worauf Sie sich beziehen. Bei DALL-E mussten Sie für jede Iteration das gesamte Bild von Grund auf neu beschreiben.
Schnellere Generierung. GPT Image 1.5 liefert Ergebnisse spürbar schneller als DALL-E 3, insbesondere bei einfachen Anfragen.
Mit Textverständnis integriert. Da die Bildgenerierung innerhalb des LLM selbst stattfindet, kann das Modell vor der Generierung über das nachdenken, was es erzeugen soll. Dies führt zu einer besseren Befolgung komplexer, mehrteiliger Prompts.

Für API-Nutzer ist der Migrationspfad von DALL-E 3 zu GPT Image 1.5 unkompliziert. Die Endpunktstruktur ist ähnlich, obwohl es Unterschiede bei den Parametern und der Preisgestaltung gibt, die berücksichtigt werden müssen.

GPT-Image-2: Der unmittelbar bevorstehende Nachfolger

GPT-Image-2 wurde noch nicht offiziell angekündigt, aber es ist zu diesem Zeitpunkt ein offenes Geheimnis. Am 4. April 2026 tauchte ein Modell, das den erwarteten Spezifikationen von GPT-Image-2 entspricht, auf LM Arena (ehemals LMSYS Chatbot Arena) auf, der crowdsource-basierten KI-Benchmark-Plattform. Die Ergebnisse waren beeindruckend.

Wir haben eine ausführliche Rezension auf Basis der LM-Arena-Daten und früher Zugangs-Tests veröffentlicht: GPT-Image-2 Vorschau-Rezension. Die Highlights:

99 % Textdarstellungsgenauigkeit. Dies war seit jeher die Achillesferse der KI-Bildgenerierung. DALL-E 3 konnte gelegentlich kurze Texte korrekt darstellen. GPT-Image-2 bewältigt Absätze, Logos und komplexe Typografie mit nahezu perfekter Genauigkeit.
Beseitigung von Farbstichen. Ein bekanntes Problem von GPT Image 1.5 — die Tendenz, ungewollte Farbtöne in generierte Bilder einzufügen — scheint in GPT-Image-2 behoben zu sein.
4K-Auflösung. Frühere Modelle erreichten maximal 1024x1024 oder ähnliche Auflösungen. GPT-Image-2 generiert nativ in bis zu 4K, was für Druck, Großformat-Displays und professionelle Design-Workflows entscheidend ist.
Neue Architektur. Obwohl OpenAI die technischen Details nicht offengelegt hat, deutet der Qualitätssprung auf eine signifikante architektonische Änderung hin, nicht auf eine inkrementelle Verbesserung gegenüber GPT Image 1.5.

Der erwartete Veröffentlichungszeitraum ist Ende April bis Mitte Mai 2026 — zeitlich passend zur DALL-E-Abschaltung, um API-Nutzern einen klaren Upgrade-Pfad zu bieten.

Die architektonische Verschiebung: Warum das wichtig ist

Der Wechsel von DALL-E zu GPT Image ist mehr als ein Produktupdate. Es ist ein philosophischer Wandel in der Funktionsweise der Bildgenerierung:

DALL-E-Architektur	GPT-Image-Architektur
Eigenständiges Diffusionsmodell	Native Fähigkeit eines multimodalen LLM
Isolierte Prompt-zu-Bild-Pipeline	Kontextbewusst innerhalb der Konversation
Textprompt ist die einzige Eingabe	Text, Bilder, Gesprächsverlauf und Reasoning fließen in die Generierung ein
Jede Generierung ist unabhängig	Iterative Verfeinerung innerhalb einer Sitzung
Separate Sicherheits-/Moderationsschicht	Sicherheit ist in das Reasoning des Modells integriert
Feste Ausgabegrößen (1024x1024 etc.)	Flexible Ausgabegrößen bis 4K

Dies ist dasselbe Muster, das wir in der gesamten KI beobachten: Spezialisierte Einzelzweck-Modelle werden von universellen multimodalen Systemen absorbiert. Die Bildgenerierung folgt demselben Weg, den Codegenerierung, Datenanalyse und Web-Browsing bereits innerhalb von ChatGPT genommen haben.

GPT Image 1.5 vs. DALL-E 3: Was sich tatsächlich geändert hat

Für die Millionen von Nutzern, die im Dezember 2025 von DALL-E 3 auf GPT Image 1.5 umgestellt wurden, war der Wechsel nicht ganz nahtlos. Einiges wurde besser. Einiges vermissen die Nutzer. Hier ist eine ehrliche Bewertung.

Was bei GPT Image 1.5 besser ist

Gesprächskontext. Dies ist die größte Verbesserung. DALL-E 3 in ChatGPT nutzte ChatGPT, um Ihren Prompt umzuschreiben, bevor er an das DALL-E-Modell gesendet wurde, aber das Bildmodell selbst hatte kein Bewusstsein für Ihr Gespräch. GPT Image 1.5 versteht den Thread nativ. Der Unterschied zeigt sich am deutlichsten bei Iterationen: „Jetzt minimalistischer gestalten" funktioniert tatsächlich wie erwartet.
Geschwindigkeit. GPT Image 1.5 generiert Bilder spürbar schneller als DALL-E 3, insbesondere bei Anfragen mit Standardkomplexität.
Text in Bildern. Obwohl noch nicht perfekt (GPT-Image-2 ist hier der eigentliche Durchbruch), bewältigt GPT Image 1.5 die Textdarstellung in den meisten Fällen besser als DALL-E 3. Kurze Phrasen, Beschriftungen und Schilder werden konsistenter und genauer dargestellt.
Prompt-Befolgung bei komplexen Szenen. Prompts mit mehreren Motiven und Aktionen, die DALL-E 3 teilweise ignorierte, werden von GPT Image 1.5 zuverlässiger umgesetzt.
Konsistenter Stil innerhalb einer Sitzung. Da das Modell den Kontext beibehält, ist es wesentlich einfacher, mehrere Bilder im selben Stil innerhalb eines Gesprächs zu generieren. Sie müssen detaillierte Stilbeschreibungen nicht für jede Generierung wiederholen.

Was Nutzer an DALL-E 3 vermissen

Bestimmte künstlerische Stile. DALL-E 3 hatte eine bestimmte Ästhetik, die einige Nutzer bevorzugten, besonders bei illustrationsartigen Ergebnissen. Es zeichnete sich durch einen „sauberen digitalen Illustrations-Look" aus, den GPT Image 1.5 nicht immer exakt reproduziert.
Vorhersagbarkeit. DALL-E 3s Verhalten war in einem engen Sinne vorhersagbarer — gleicher Prompt, ähnliches Ergebnis. Die Kontextbewusstheit von GPT Image 1.5 bedeutet, dass es je nach Gesprächsverlauf unterschiedliche Ergebnisse liefern kann, was meist ein Vorteil, gelegentlich aber auch eine Frustration ist.
Die Bearbeitungsendpunkte. DALL-E 2s Inpainting und Outpainting waren spezifische Funktionen, die in der GPT-Image-API noch keine direkten Entsprechungen haben. Nutzer, die Workflows um diese Funktionen herum aufgebaut haben, brauchen alternative Ansätze.
Preistransparenz. DALL-E 3 hatte eine unkomplizierte Pro-Bild-Preisgestaltung. Die Preisgestaltung von GPT Image 1.5 über die API basiert auf Tokens, was die Budgetplanung erschweren kann.

Die Gesamtbewertung

Für die meisten Nutzer und Anwendungsfälle ist GPT Image 1.5 ein klares Upgrade gegenüber DALL-E 3. Allein die Fähigkeiten des Gesprächskontexts und der iterativen Verfeinerung machen es zum besseren Werkzeug für alle, die Bilder als Teil eines kreativen Workflows generieren. Am stärksten betroffen vom Übergang sind diejenigen, die spezifische Automatisierungs-Pipelines rund um das genaue Verhalten und die API-Struktur von DALL-E 3 aufgebaut haben.

GPT-Image-2: Der wahre Nachfolger

Wenn GPT Image 1.5 die Brücke ist, dann ist GPT-Image-2 das Ziel. Basierend auf den LM-Arena-Ergebnissen vom 4. April und Berichten aus dem frühen Zugang stellt GPT-Image-2 einen Generationssprung dar, der die DALL-E-Einstellung weniger wie einen Verlust und mehr wie eine notwendige Weichenstellung erscheinen lässt.

Was wir bisher wissen

Wir haben GPT-Image-2 in unserer ausführlichen Rezension detailliert behandelt, aber hier sind die wichtigsten Fakten im Kontext der DALL-E-Einstellung:

Textdarstellung ist im Wesentlichen gelöst. 99 % Genauigkeit bei Text in Bildern. Dies war die häufigste Beschwerde über jedes Bildgenerierungsmodell seit DALL-Es Einführung. GPT-Image-2 bewältigt mehrzeiligen Text, verschiedene Schriftarten, Logos und typografische Layouts mit nahezu perfekter Wiedergabetreue.
Native 4K-Auflösung. Keine Upscaling-Tricks. Das Modell generiert nativ in bis zu 4096x4096. Für professionelles Design, Druckproduktion und hochauflösende Marketingmaterialien beseitigt dies eine wesentliche Einschränkung.
Das Farbstichproblem ist behoben. GPT Image 1.5 neigt bekanntlich dazu, ungewollte warme oder kühle Farbtöne einzufügen. GPT-Image-2 produziert standardmäßig neutrale, akkurate Farben und reagiert dennoch auf Farbanweisungen in Prompts.
Fotorealismus erreicht ein neues Niveau. Vergleiche nebeneinander zeigen, dass GPT-Image-2 fotorealistische Ergebnisse liefert, die wesentlich schwerer von echten Fotografien zu unterscheiden sind als bei jedem früheren Modell.
Stilbandbreite. Frühe Tests deuten darauf hin, dass GPT-Image-2 eine breitere Palette künstlerischer Stile beherrscht als GPT Image 1.5, was möglicherweise die Beschwerden derjenigen adressiert, die DALL-E 3s Illustrationsfähigkeiten bevorzugten.

Erwartete Verfügbarkeit

OpenAI hat kein offizielles Veröffentlichungsdatum veröffentlicht, aber mehrere Signale deuten auf Ende April oder Anfang bis Mitte Mai 2026 hin. Das Timing ergibt strategisch Sinn: Die Verfügbarkeit von GPT-Image-2 vor dem 12. Mai anzukündigen, gibt DALL-E-API-Nutzern einen überzeugenden Grund zur Migration, anstatt sie nur durch eine Frist vom alten Modell zu vertreiben.

Für API-Nutzer, die ihre Migration planen, lautet der praktische Rat: Migrieren Sie jetzt zu GPT Image 1.5, um die Kontinuität am 12. Mai zu gewährleisten, und wechseln Sie dann zu GPT-Image-2, sobald es verfügbar ist.

Die Wettbewerbslandschaft ohne DALL-E

Die Einstellung von DALL-E geschieht nicht im luftleeren Raum. Der Markt für KI-Bildgenerierung ist 2026 weitaus wettbewerbsintensiver als beim ersten Start von DALL-E 2 im Jahr 2022. Hier erfahren Sie, wer von DALL-Es Abgang profitiert und wo der Markt steht.

Midjourney

Midjourney ist seit 2022 DALL-Es Hauptkonkurrent im Verbrauchermarkt. Mit dem Wegfall von DALL-E wird Midjourney zur prominentesten eigenständigen Marke für KI-Bildgenerierung. Ihr V7-Modell, das Anfang 2026 veröffentlicht wurde, liefert außergewöhnliche Ergebnisse für künstlerische und kreative Anwendungsfälle. Midjourneys Stärke lag schon immer in ästhetischer Qualität und Community — sie haben eine loyale Nutzerbasis aufgebaut, die ohnehin nie zu DALL-E gewechselt wäre.

DALL-Es Einstellung könnte einige Nutzer zu Midjourney treiben, die ein dediziertes Bildgenerierungstool einem integrierten ChatGPT-Erlebnis vorziehen. Allerdings beschränken Midjourneys Discord-zentriertes Interface und das Fehlen einer vollwertigen API (ihre Web-App ist noch relativ neu) die Attraktivität für Entwickler und Unternehmenskunden.

Flux (von Black Forest Labs)

Flux hat sich als Open-Source-Marktführer in der Bildgenerierung etabliert. Flux Pro und Flux Dev bieten eine Qualität, die mit DALL-E 3 konkurrieren kann, und das Open-Source-Modell Flux Schnell ist zum Standard für Entwickler geworden, die schnelle, kostenlose Bildgenerierung wollen, die sie lokal ausführen können. DALL-Es Einstellung stärkt Flux' Position als primäre Alternative für Entwickler, die mehr Kontrolle über ihren Bildgenerierungs-Stack wollen und nicht von OpenAIs Produktentscheidungen abhängig sein möchten.

Ideogram

Ideogram hat sich früh eine Nische mit überlegener Textdarstellung in Bildern geschaffen — genau der Bereich, in dem DALL-E durchgehend Schwächen zeigte. Da GPT-Image-2 Berichten zufolge das Textproblem löst, sieht sich Ideogram neuem Wettbewerbsdruck von oben ausgesetzt, aber DALL-Es Wegfall als Mittelklasse-Option könnte mehr Nutzer zu Ideograms spezialisierten Stärken in Design und typografiefokussierter Generierung treiben.

Nano Banana Pro und Nano Banana 2

Nano Banana hat als schnelle, hochwertige Option, die sich bei Fotorealismus auszeichnet, an Zugkraft gewonnen. Wie wir in unserer GPT-Image-2-Vergleichsrezension dargelegt haben, konkurriert Nano Banana 2 bei mehreren Benchmarks direkt mit GPT-Image-2. DALL-Es Abgang eröffnet Marktanteile, die Nano Banana gut besetzen kann, insbesondere für API-Nutzer, die Alternativen zu OpenAIs Ökosystem suchen.

Stable Diffusion (von Stability AI)

Stability AI hatte einige turbulente Jahre, aber Stable Diffusion bleibt eines der am weitesten verbreiteten Bildgenerierungsmodelle, insbesondere im Open-Source- und Self-Hosted-Bereich. Die SD3- und SDXL-Ökosysteme verfügen über riesige Communities mit feinabgestimmten Modellen und Tools. Für Nutzer, die maximale Anpassung, lokale Inferenz oder spezialisiertes Fine-Tuning wünschen, bleibt Stable Diffusion die primäre Option. DALL-Es Wegfall wirkt sich nicht direkt auf dieses Marktsegment aus, verstärkt aber den Trend zu entweder vollständig integrierten Lösungen (wie GPT Image) oder vollständig offenen (wie SD).

Googles Imagen und Gemini

Googles Imagen 3, verfügbar über Gemini und die Vertex-AI-API, ist ein weiteres in multimodale LLMs integriertes Bildgenerierungssystem. Google verfolgt einen ähnlichen architektonischen Weg wie OpenAI: Bildgenerierung als native Fähigkeit der konversationellen KI statt als eigenständiger Dienst. DALL-Es Einstellung bestätigt diesen Ansatz und könnte Googles Investitionen in Geminis Bildfähigkeiten beschleunigen.

Das große Bild

DALL-Es Abgang gliedert den Markt in drei Stufen:

Integrierte multimodale Plattformen (OpenAI GPT Image, Google Gemini/Imagen) — Bildgenerierung als Feature einer universellen KI
Dedizierte Bildgenerierungsdienste (Midjourney, Ideogram, Nano Banana) — spezialisierte Tools für Nutzer, die Bildqualität und kreative Kontrolle priorisieren
Open Source und Self-Hosted (Flux, Stable Diffusion) — maximale Kontrolle und Anpassung für Entwickler und Unternehmen mit spezifischen Anforderungen

DALL-E besetzte eine unbequeme Zwischenposition: ein eigenständiges Bildmodell von einem Unternehmen, das sich zunehmend auf integrierte multimodale KI konzentrierte. Seine Einstellung löst diese Spannung auf.

Marktanteilsimplikationen

DALL-Es Einstellung verteilt eine bedeutende Nutzerbasis um. Obwohl genaue Zahlen nicht öffentlich sind, war DALL-E 3 eine der am weitesten verbreiteten Bildgenerierungs-APIs, insbesondere unter Unternehmenskunden, die für all ihre KI-Anforderungen standardmäßig auf OpenAIs Ökosystem setzten. Diese Nutzer stehen nun vor einer Wahl: im OpenAI-Ökosystem bleiben (GPT Image 1.5 / GPT-Image-2), auf spezialisierte Tools diversifizieren oder Multi-Modell-Plattformen nutzen, die von mehreren Anbietern abstrahieren.

Die Entwickler, die am ehesten OpenAIs Bildgenerierungs-Ökosystem ganz verlassen werden, sind diejenigen, die bereits mit DALL-E 3s Einschränkungen frustriert waren — insbesondere bei Textdarstellung, künstlerischer Kontrolle und dem Fehlen von Fine-Tuning-Optionen. Für diese Nutzer waren Flux' Open-Source-Anpassbarkeit oder Midjourneys überlegene ästhetische Qualität bereits verlockend. Die erzwungene Migration beseitigt die Trägheit als Faktor.

Was API-Nutzer vor dem 12. Mai tun müssen: Eine Migrations-Checkliste

Wenn Sie ein Produktionssystem betreiben, das die DALL-E 2- oder DALL-E 3-API aufruft, läuft die Uhr. Hier ist ein praktischer Migrationsplan.

Schritt 1: DALL-E-Nutzung prüfen

Durchsuchen Sie Ihre Codebasis nach Verweisen auf die Modellnamen dall-e-2 und dall-e-3
Prüfen Sie Aufrufe an /v1/images/generations, /v1/images/edits und /v1/images/variations
Überprüfen Sie die Nutzungsprotokolle in Ihrem OpenAI-Dashboard, um alle Anwendungen zu identifizieren, die DALL-E-Endpunkte nutzen
Prüfen Sie No-Code/Low-Code-Tools (Zapier, Make, Retool etc.) auf DALL-E-Integrationen
Überprüfen Sie gegebenenfalls Azure-OpenAI-Bereitstellungen

Schritt 2: API-Unterschiede verstehen

Modellnamenänderung: Aktualisieren Sie "model": "dall-e-3" auf den entsprechenden GPT-Image-Modellbezeichner
Parameterunterschiede: Einige DALL-E-spezifische Parameter (wie quality, style) können in der GPT-Image-API anders funktionieren oder andere gültige Werte haben
Antwortformat: Überprüfen Sie, dass die Antwortstruktur mit Ihrer Parsing-Logik übereinstimmt
Preismodell: GPT Image verwendet Token-basierte Preisgestaltung anstelle einer Pro-Bild-Preisgestaltung. Aktualisieren Sie Ihr Kosten-Tracking und Ihre Budgetplanung entsprechend
Rate Limits: Prüfen Sie, ob Ihre Rate Limits für die neuen Endpunkte zu Ihren Nutzungsmustern passen

Schritt 3: Aktualisieren und testen

Aktualisieren Sie Ihr OpenAI SDK auf die neueste Version (ältere Versionen unterstützen möglicherweise die GPT-Image-Endpunkte nicht)
Passen Sie API-Aufrufe an, um das neue Modell und den neuen Endpunkt anzusprechen
Führen Sie Ihre bestehende Prompt-Sammlung gegen GPT Image 1.5 aus und vergleichen Sie die Ergebnisse
Testen Sie Grenzfälle: sehr lange Prompts, Prompts mit spezifischen Stilanforderungen, Prompts, die mit DALL-Es besonderer Ästhetik zuvor gut funktionierten
Wenn Sie DALL-E 2s Bearbeitungs- oder Variationen-Endpunkte genutzt haben, implementieren Sie alternative Workflows (GPT Image behandelt iterative Bearbeitung über den Gesprächskontext statt über dedizierte Endpunkte)

Schritt 4: Die Inpainting-/Outpainting-Lücke schließen

Wenn Ihr Produkt auf DALL-E 2s /v1/images/edits-Endpunkt für Inpainting oder Outpainting angewiesen war, brauchen Sie einen alternativen Ansatz. Optionen sind:

Nutzung von GPT Images konversationellen Bearbeitungsfähigkeiten (beschreiben Sie die gewünschte Bearbeitung in natürlicher Sprache)
Integration einer alternativen Inpainting-Lösung (Flux Fill, Stable Diffusion Inpainting)
Warten auf GPT-Image-2, das voraussichtlich robustere Bearbeitungsfähigkeiten bieten wird

Schritt 5: Dokumentation und Kommunikation aktualisieren

Aktualisieren Sie Ihre Produktdokumentation, um den Modellwechsel widerzuspiegeln
Wenn Ihr Produkt „Powered by DALL-E" oder ähnliches Branding nennt, aktualisieren Sie es
Informieren Sie Nutzer, wenn die Änderung ihr Erlebnis beeinflusst (anderer Ausgabestil, Preisänderungen etc.)
Aktualisieren Sie Ihre Nutzungsbedingungen oder Datenschutzerklärung, wenn diese auf bestimmte OpenAI-Modelle verweisen

Schritt 6: GPT-Image-2 einplanen

Migrieren Sie jetzt zu GPT Image 1.5, um die Kontinuität am 12. Mai sicherzustellen
Gestalten Sie Ihre Integration so, dass ein Modellwechsel einfach ist (konfigurationsbasierte Modellauswahl statt fest codierter Werte)
Wenn GPT-Image-2 erscheint, testen Sie es an Ihren Anwendungsfällen, bevor Sie den Produktionsverkehr umleiten
Erwägen Sie, Nutzern eine Auswahl zwischen Modellen anzubieten, wenn die Qualitätsanforderungen Ihres Produkts dies rechtfertigen

OpenAIs Kreativproduktstrategie: Ein Muster wird erkennbar

Betrachtet man die DALL-E-Einstellung aus der Vogelperspektive, zeichnet sich ein klares Muster in OpenAIs Produktentscheidungen des letzten Jahres ab.

Der Rückzug von eigenständigen Kreativtools

März 2026: Sora eingestellt. OpenAIs Text-zu-Video-Modell, das Anfang 2024 mit enormem Hype gestartet war, wurde eingestellt, nachdem es mit Konkurrenz, Kostenstruktur und Sicherheitsbedenken zu kämpfen hatte. Die Videogenerierungsfähigkeiten werden in das ChatGPT/API-Ökosystem integriert, anstatt als separates Produkt gepflegt zu werden.

Mai 2026: DALL-E eingestellt. Der Bildgenerierungspionier, eingestellt zugunsten integrierter multimodaler Generierung innerhalb der GPT-Modelle.

Zwei von OpenAIs öffentlich sichtbarsten kreativen KI-Produkten, verschwunden innerhalb von zwei Monaten. Das ist kein Zufall — das ist Strategie.

Die Integrationsthese

OpenAIs Wette ist, dass kreative Fähigkeiten als Features eines universellen KI-Systems wertvoller sind als als eigenständige Produkte. Die Begründung:

Kontext ist entscheidend. Ein Bildgenerierungsmodell, das Ihr Gespräch, Ihr Projekt und Ihre Präferenzen versteht, liefert bessere Ergebnisse als eines, das jeden Prompt isoliert betrachtet.
Wartungskosten. Separate Modelle für Text, Bilder, Video, Code und andere Modalitäten zu betreiben, ist teuer und komplex. Die Konsolidierung in einer einzigen multimodalen Architektur ist effizienter.
Nutzererfahrung. Nutzer wollen nicht zwischen Tools hin und her wechseln. Sie wollen eine Oberfläche, die alles kann. Die Beliebtheit von „GPT, erstelle mir ein Bild" innerhalb von ChatGPT im Vergleich zum Öffnen eines separaten DALL-E-Tools beweist das.
Wettbewerbspositionierung. Der Markt für eigenständige Bildgenerierung ist überfüllt (Midjourney, Flux, Ideogram, Stable Diffusion). Der Markt für integrierte multimodale KI ist weniger umkämpft und schwerer zu replizieren.

Was das für die Branche bedeutet

OpenAIs Schritt signalisiert einen breiteren Trend, der die gesamte KI-Branche betreffen wird:

Eigenständige kreative KI-Tools stehen unter Konsolidierungsdruck. Wenn das größte KI-Unternehmen der Welt entschieden hat, dass eigenständige Bild- und Videogenerierungsmodelle es nicht wert sind, separat betrieben zu werden, sollten kleinere Unternehmen, die ähnliche eigenständige Produkte entwickeln, aufhorchen.
Multimodal ist der neue Standard. Erwarten Sie, dass Google (Gemini), Anthropic (Claude) und andere große KI-Labore ihre eigenen multimodalen Fähigkeiten beschleunigen. Die Erwartung verschiebt sich von „Kann Ihre KI Bilder generieren?" zu „Kann Ihre KI Bilder, Video, Audio und Code innerhalb eines einzigen Gesprächs generieren?"
API-Stabilität wird zu einem echten Problem. Entwickler, die auf DALL-E gebaut haben, werden nun zur Migration gezwungen. Diese Erfahrung wird Teams vorsichtiger machen bei tiefer Integration mit einem einzelnen Modell und sie stärker an Abstraktionsschichten interessieren, die sie von Upstream-Modelländerungen isolieren.
Der Open-Source-Vorteil wächst. Etwas, das Flux und Stable Diffusion bieten können und OpenAI nicht: Sie werden nicht durch eine Unternehmensentscheidung eingestellt. Für Organisationen, die langfristige Stabilität brauchen, werden selbstgehostete Open-Source-Modelle nach der Einstellung von DALL-E und Sora attraktiver.
Abstraktionsschichten werden zu unverzichtbarer Infrastruktur. Die DALL-E-Einstellung ist eine Fallstudie dafür, warum direkte Modellkopplung riskant ist. Erwarten Sie mehr Nachfrage nach Middleware und Orchestrierungsplattformen, die Anwendungen von bestimmten Modellanbietern entkoppeln.

Genras Perspektive

Wir fassen uns kurz, denn in diesem Artikel geht es um DALL-E und OpenAIs Strategie, nicht um uns. Aber die DALL-E-Einstellung veranschaulicht etwas, worauf wir unsere Plattform aufgebaut haben.

Bei Genra integrieren wir im Hintergrund mehrere Bild- und Videogenerierungsmodelle. Wenn Sie Inhalte über Genra erstellen, wählt unsere Multi-Modell-Orchestrierungsschicht das beste verfügbare Modell für Ihre spezifische Anfrage — unter Berücksichtigung von Faktoren wie Bildtyp, Stilanforderungen, Auflösungsbedarf und Geschwindigkeit. Wenn DALL-E am 12. Mai eingestellt wird, werden Genra-Nutzer nichts bemerken. Die Orchestrierungsschicht wird einfach aufhören, an DALL-E-Endpunkte weiterzuleiten, und weiterhin an GPT Image 1.5, GPT-Image-2 (sobald verfügbar) und andere Modelle in unserem Stack weiterleiten.

Das ist der Vorteil der Arbeit auf Plattformebene statt direkt mit einzelnen Modell-APIs. Modelle kommen und gehen. Produkte werden eingestellt. Die Plattformen, die über mehrere Modelle abstrahieren, bieten eine Kontinuität, die Einzelmodell-Integrationen nicht leisten können.

Kernaussagen

Die APIs von DALL-E 2 und DALL-E 3 werden am 12. Mai 2026 abgeschaltet. Beide Endpunkte werden keine Anfragen mehr annehmen. Wenn Sie Produktionsintegrationen haben, ist die Migration obligatorisch, nicht optional.
ChatGPT-Nutzer sind bereits auf GPT Image 1.5. Der Übergang für Verbraucher fand im Dezember 2025 statt. Der 12. Mai betrifft hauptsächlich API-Nutzer und Azure-OpenAI-Bereitstellungen.
GPT Image 1.5 ist der unmittelbare Ersatz. Es ist live, über die API verfügbar und ein echtes Upgrade in Bezug auf Gesprächskontext und iterative Verfeinerung.
GPT-Image-2 steht unmittelbar bevor. Erwartet Ende April bis Mitte Mai 2026, mit 99 % Textdarstellung, 4K-Auflösung und behobenen Farbstichproblemen. Dies ist der wahre Nachfolger von DALL-E.
Die architektonische Verschiebung geht von eigenständig zu integriert. OpenAI verlagert die Bildgenerierung von einem separaten Modell zu einer nativen Fähigkeit seiner LLMs. Denselben Weg geht Google mit Gemini/Imagen.
Die Einstellungen von Sora und DALL-E zeigen eine klare Strategie. OpenAI zieht sich von eigenständigen Kreativtools zurück zugunsten von Fähigkeiten, die in ChatGPT und die API integriert sind. Erwarten Sie, dass sich dieser Trend fortsetzt.
Die Wettbewerbslandschaft profitiert alle anderen. Midjourney, Flux, Ideogram, Nano Banana und Stable Diffusion gewinnen alle Marktanteile, da DALL-E den eigenständigen Bildgenerierungsmarkt verlässt.
API-Stabilität ist ein wachsendes Problem. Zwei große Modelleinstellungen in zwei Monaten werden Entwickler zu Abstraktionsschichten und Multi-Modell-Plattformen treiben, die vor Upstream-Änderungen schützen.

Häufig gestellte Fragen

Wann genau wird DALL-E abgeschaltet?

Sowohl die APIs von DALL-E 2 als auch DALL-E 3 werden am 12. Mai 2026 keine Anfragen mehr annehmen. Nach diesem Datum gibt jeder API-Aufruf, der ein DALL-E-Modell angibt, eine Fehlermeldung zurück. Die ChatGPT-Bildgenerierung ist nicht betroffen, da sie bereits im Dezember 2025 auf GPT Image 1.5 umgestellt wurde.

Werden meine bestehenden, mit DALL-E generierten Bilder gelöscht?

Nein. Bilder, die Sie bereits mit DALL-E generiert haben, gehören Ihnen und werden nicht entfernt. Die Einstellung betrifft nur die Möglichkeit, neue Bilder über DALL-E-Endpunkte zu generieren. Alle in Ihrem OpenAI-Kontoverlauf gespeicherten oder lokal heruntergeladenen Bilder bleiben zugänglich.

Was ist der direkte Ersatz für die DALL-E 3 API?

GPT Image 1.5 ist der aktuelle Ersatz, verfügbar über OpenAIs API. GPT-Image-2 wird voraussichtlich Ende April bis Mitte Mai 2026 als weiteres Upgrade eingeführt. Die API-Struktur ist ähnlich, aber nicht identisch zu DALL-E 3 — Sie müssen Modellnamen aktualisieren, Parameteränderungen prüfen und sich auf Token-basierte Preisgestaltung einstellen.

Ist GPT Image 1.5 besser als DALL-E 3?

Für die meisten Anwendungsfälle ja. GPT Image 1.5 bietet besseres Kontextbewusstsein im Gespräch, schnellere Generierung, verbesserte Textdarstellung und stärkere Befolgung komplexer Prompts. Einige Nutzer vermissen DALL-E 3s besondere Illustrationsästhetik und die Vorhersagbarkeit seiner Ergebnisse. Die Bearbeitungsendpunkte (Inpainting, Outpainting, Variationen) von DALL-E 2 haben noch keine direkten Entsprechungen.

Was ist mit Sora passiert, und hängt es mit der DALL-E-Abschaltung zusammen?

OpenAI hat Sora, sein Text-zu-Video-Modell, im März 2026 eingestellt. Obwohl OpenAI die beiden Entscheidungen nicht explizit verknüpft hat, folgen sie demselben Muster: Einstellung eigenständiger kreativer KI-Produkte und Integration dieser Fähigkeiten in multimodale Systeme innerhalb von ChatGPT und der API. Beide Entscheidungen spiegeln OpenAIs strategischen Wandel weg von der Pflege separater Modelle für jede kreative Modalität wider.

Sind Azure-OpenAI-DALL-E-Bereitstellungen ebenfalls betroffen?

Ja. Azure-OpenAI-Kunden, die DALL-E 2 oder DALL-E 3 über den Azure OpenAI Service bereitgestellt haben, sind vom selben Abschaltdatum am 12. Mai 2026 betroffen. Microsoft hat Migrationsleitfäden für Azure-Kunden herausgegeben. Prüfen Sie die Dokumentation des Azure OpenAI Service für Azure-spezifische Migrationspfade und alternative Modellbereitstellungen.

Was sollte ich für Inpainting oder Outpainting verwenden, da die DALL-E 2-Endpunkte eingestellt werden?

Sie haben mehrere Optionen: Nutzen Sie GPT Images konversationelle Bearbeitung (beschreiben Sie die gewünschte Bearbeitung in natürlicher Sprache), integrieren Sie eine Alternative wie Flux Fill oder Stable Diffusion Inpainting für programmatische Nutzung, oder warten Sie auf GPT-Image-2, das voraussichtlich erweiterte Bearbeitungsfähigkeiten bieten wird. Der Ansatz hängt davon ab, ob Sie programmatischen API-Zugang benötigen oder innerhalb einer konversationellen Schnittstelle arbeiten können.

Wie wirkt sich dies auf Plattformen wie Genra aus, die mehrere KI-Modelle nutzen?

Multi-Modell-Plattformen sind von der Einstellung einzelner Modelle am wenigsten betroffen. Plattformen wie Genra, die im Hintergrund mehrere Bildgenerierungsmodelle integrieren, können Anfragen automatisch umleiten, wenn ein Modell eingestellt wird, und so sicherstellen, dass Nutzer keine Unterbrechung erleben. Dies ist einer der praktischen Vorteile einer Plattformschicht gegenüber der direkten Integration mit der API eines einzelnen Modells.

Über den Autor
Das Genra-AI-Team berichtet über Entwicklungen in der KI-Bild- und Videogenerierung. Folgen Sie @GenraAI für Updates und Analysen zur sich rasant entwickelnden Landschaft kreativer KI-Tools.