DALL-E è morto: OpenAI ritira i suoi modelli di immagine il 12 maggio
· Genra AIOpenAI spegne sia DALL-E 2 che DALL-E 3 il 12 maggio 2026. Insieme alla chiusura di Sora a marzo, questo segna la fine di due dei prodotti creativi AI più iconici di OpenAI. I sostituti sono già qui — e sono fondamentalmente diversi da ciò che c'era prima.
Il 12 maggio 2026, OpenAI staccherà la spina a DALL-E. Sia DALL-E 2 che DALL-E 3 — i modelli di generazione immagini che hanno introdotto milioni di persone all'arte generata dall'intelligenza artificiale — smetteranno di rispondere alle chiamate API. Gli endpoint restituiranno errori. I modelli cesseranno di funzionare.
Non si tratta di una sorpresa. OpenAI ha segnalato questa mossa per mesi. Gli utenti di ChatGPT sono stati automaticamente trasferiti da DALL-E 3 a GPT Image 1.5 già a dicembre 2025. L'avviso di deprecazione delle API è stato pubblicato a inizio 2026. Ma la data effettiva di spegnimento — il 12 maggio — rende tutto concreto in un modo che gli avvisi di deprecazione non riescono a fare.
Ciò che rende questo momento significativo non è solo il ritiro di un prodotto popolare. È il pattern che rappresenta. A marzo 2026, OpenAI ha chiuso Sora, il suo modello text-to-video. Ora segue DALL-E. Due degli strumenti creativi AI più riconoscibili di OpenAI, scomparsi a distanza di due mesi l'uno dall'altro.
I sostituti raccontano una storia sulla direzione della generazione di immagini AI. Invece di modelli standalone monofunzionali, OpenAI scommette sulla generazione di immagini integrata direttamente nei suoi modelli linguistici di grandi dimensioni. GPT Image 1.5 è già operativo. GPT-Image-2 è imminente. L'architettura è cambiata radicalmente.
Questo articolo copre tutto ciò che devi sapere: la cronologia completa della vita e della morte di DALL-E, cosa viene ritirato esattamente, cosa lo sostituisce, come si confrontano i sostituti e cosa devono fare sviluppatori e aziende prima del 12 maggio.
La cronologia: il percorso di DALL-E dalla rivoluzione al ritiro
DALL-E ha avuto uno dei cicli di vita prodotto più compressi nella storia dell'AI. Dal primo paper di ricerca al ritiro completo in poco più di cinque anni.
Gennaio 2021: DALL-E (originale)
OpenAI pubblicò un blog post di ricerca che presentava DALL-E, una versione da 12 miliardi di parametri di GPT-3 addestrata per generare immagini da descrizioni testuali. Era un'anteprima di ricerca, non un prodotto. Nessun accesso pubblico. Ma il concetto — scrivi una frase, ottieni un'immagine — catturò l'immaginazione dell'intero mondo tech. Il nome, un portmanteau di Salvador Dalì e WALL-E, divenne immediatamente iconico.
L'originale DALL-E poteva generare immagini da prompt come "una poltrona a forma di avocado" o "un'illustrazione professionale di alta qualità di un piccolo daikon in tutù che porta a spasso un cane". I risultati erano grezzi per gli standard odierni, ma nel 2021 sembravano fantascienza.
Aprile 2022: DALL-E 2
DALL-E 2 è stata la versione che ha cambiato tutto. OpenAI lo rilasciò con un sistema a lista d'attesa che generò una domanda enorme. Il modello utilizzava un'architettura basata sulla diffusione (un cambiamento significativo rispetto all'approccio VAE discreto dell'originale) e produceva immagini di qualità notevolmente superiore a risoluzioni più elevate.
DALL-E 2 introdusse funzionalità chiave: l'inpainting (modifica di parti specifiche di un'immagine), l'outpainting (estensione delle immagini oltre i loro confini originali) e le variazioni (generazione di immagini simili basate su un riferimento caricato). Passò da curiosità accademica a prodotto mainstream. Artisti, designer, marketer e appassionati inondarono la piattaforma.
L'API fu lanciata più tardi nel 2022, consentendo agli sviluppatori di integrare DALL-E 2 nelle proprie applicazioni. Fu l'inizio di DALL-E come infrastruttura — non solo un giocattolo per consumatori, ma un componente per costruire altri prodotti.
Ottobre 2023: DALL-E 3
DALL-E 3 fu integrato direttamente in ChatGPT, una mossa che prefigurava la direzione che OpenAI avrebbe infine intrapreso. Invece di richiedere agli utenti di visitare un'interfaccia separata, DALL-E 3 poteva generare immagini durante una conversazione. Chiedi a ChatGPT di spiegare un concetto, poi chiedigli di illustrarlo — tutto nello stesso thread.
La qualità del modello fece un salto significativo. DALL-E 3 era molto più bravo a seguire prompt complessi, a renderizzare testo all'interno delle immagini (ancora imperfetto, ma notevolmente migliorato) e a produrre composizioni coerenti con soggetti multipli. Fu inoltre lanciato con un sistema di sicurezza integrato sviluppato con il layer di moderazione di ChatGPT.
Aspetto cruciale, DALL-E 3 fu reso disponibile anche tramite API, mantenendo la compatibilità all'indietro e offrendo al contempo un modello sostanzialmente più capace.
2025: generazione immagini con GPT-4o e l'inizio della fine
La fine era prevedibile quando OpenAI introdusse capacità native di generazione immagini all'interno di GPT-4o. Invece di invocare un modello DALL-E separato, GPT-4o poteva generare immagini come parte del proprio output multimodale. Non era un wrapper attorno a DALL-E — era un'architettura fondamentalmente diversa in cui la generazione di immagini era una capacità nativa del modello linguistico stesso.
La qualità era competitiva con DALL-E 3 e l'esperienza utente era superiore. Nessun cambio di modalità, nessuna invocazione di modello separata. Solo una conversazione che poteva produrre testo, codice e immagini in modo fluido.
Dicembre 2025: GPT Image 1.5 sostituisce DALL-E 3 in ChatGPT
A dicembre 2025, OpenAI sostituì silenziosamente DALL-E 3 con GPT Image 1.5 come modello predefinito di generazione immagini in ChatGPT. Gli utenti che utilizzavano DALL-E 3 tramite ChatGPT furono migrati automaticamente. Per la maggior parte degli utenti occasionali, la transizione fu indolore — semplicemente notarono che la generazione di immagini era diventata più veloce e più reattiva al contesto conversazionale.
Questo fu il segnale più chiaro che i giorni di DALL-E erano contati. OpenAI aveva già spostato il suo prodotto consumer di punta su un altro modello.
Inizio 2026: annuncio di deprecazione
OpenAI annunciò formalmente che le API di DALL-E 2 e DALL-E 3 sarebbero state ritirate, con il 12 maggio 2026 come data di spegnimento. L'annuncio diede agli utenti API circa quattro mesi per migrare le proprie integrazioni ai nuovi endpoint GPT Image.
Marzo 2026: chiusura di Sora
Prima ancora che DALL-E raggiunga la sua data di spegnimento, OpenAI ritirò Sora, il suo modello di generazione video da testo. La motivazione ufficiale citava la riallocazione delle risorse, ma il pattern era evidente: OpenAI stava ritirandosi dagli strumenti creativi AI standalone a favore di capacità integrate nei suoi prodotti LLM principali.
12 maggio 2026: DALL-E si spegne
L'endpoint smette di rispondere. Cinque anni e quattro mesi dopo il blog post originale su DALL-E, la linea di prodotto è definitivamente ritirata.
Cosa viene ritirato esattamente il 12 maggio
Vediamo nel dettaglio cosa smette di funzionare e cosa no.
Cosa si spegne
- API di DALL-E 2 — L'endpoint del modello
dall-e-2smette di accettare richieste. Qualsiasi applicazione che chiamaPOST /v1/images/generationscon"model": "dall-e-2"riceverà un errore. - API di DALL-E 3 — L'endpoint del modello
dall-e-3smette di accettare richieste. Lo stesso vale: qualsiasi chiamata API che specifica DALL-E 3 come modello fallirà. - Endpoint di editing immagini DALL-E — L'endpoint
/v1/images/edits(inpainting) che si appoggiava a DALL-E 2 non funzionerà più. - Endpoint variazioni DALL-E — Anche l'endpoint
/v1/images/variationsviene ritirato. - Deployment DALL-E su Azure OpenAI — Anche i clienti Azure che hanno distribuito DALL-E 2 o DALL-E 3 tramite Azure OpenAI Service saranno coinvolti. Microsoft ha pubblicato le proprie linee guida per la migrazione allineate alla data del 12 maggio.
Cosa NON viene toccato
- Generazione immagini di ChatGPT — ChatGPT è già passato a GPT Image 1.5 a dicembre 2025. Se generi immagini tramite ChatGPT (web, mobile o app desktop), per te non cambia nulla il 12 maggio.
- Immagini generate in precedenza — Le immagini che hai già creato con DALL-E sono tue. Non scompaiono. Ma la possibilità di generarne di nuove tramite gli endpoint DALL-E finisce.
- Endpoint API GPT Image — I più recenti endpoint di generazione immagini che utilizzano GPT Image 1.5 (e presto GPT-Image-2) continuano a funzionare normalmente.
Impatto sulle integrazioni esistenti
È qui che il vero impatto si fa sentire. Qualsiasi applicazione, servizio o workflow che effettua chiamate API dirette a DALL-E 2 o DALL-E 3 smetterà di funzionare il 12 maggio se non viene migrato. Questo include:
- Prodotti SaaS che offrono generazione di immagini AI basata su DALL-E
- Strumenti di marketing automation con integrazioni DALL-E
- Strumenti di design e plugin Figma/Canva che chiamano l'API DALL-E
- Strumenti interni personalizzati basati sugli endpoint DALL-E
- Workflow no-code/low-code (Zapier, Make, ecc.) che fanno riferimento ai nomi dei modelli DALL-E
- App mobile che utilizzano l'SDK OpenAI con specificazione del modello DALL-E
Se mantieni una qualsiasi di queste, il 12 maggio è una scadenza inderogabile.
Cosa sostituisce DALL-E: il passaggio alla generazione integrata nei LLM multimodali
Il ritiro di DALL-E non è un semplice scambio di prodotto. Rappresenta un cambiamento architetturale fondamentale nell'approccio di OpenAI alla generazione di immagini. Il vecchio modello: un sistema specializzato di generazione immagini che riceve un prompt testuale e restituisce un'immagine. Il nuovo modello: un LLM multimodale capace di generare immagini come una delle sue modalità di output native, con piena consapevolezza del contesto della conversazione.
GPT Image 1.5: l'attuale predefinito
GPT Image 1.5 è il modello predefinito per la generazione di immagini in ChatGPT da dicembre 2025. È disponibile anche tramite API. Ecco cosa lo caratterizza:
- Generazione consapevole della conversazione. A differenza di DALL-E, che trattava ogni prompt come una richiesta isolata, GPT Image 1.5 comprende l'intero contesto della conversazione. Se hai discusso di linee guida del brand per 10 messaggi, l'immagine generata riflette l'intera conversazione — non solo il prompt finale.
- Perfezionamento iterativo. Puoi dire "rendi lo sfondo più scuro" o "sposta il testo a sinistra" e GPT Image 1.5 capisce a cosa ti riferisci. DALL-E richiedeva di ridescrivere l'intera immagine da zero per ogni iterazione.
- Generazione più veloce. GPT Image 1.5 produce risultati sensibilmente più veloci rispetto a DALL-E 3, soprattutto per richieste semplici.
- Integrato con il ragionamento testuale. Poiché la generazione delle immagini avviene all'interno del LLM stesso, il modello può ragionare su cosa generare prima di generarlo. Questo porta a una migliore aderenza ai prompt complessi e multi-parte.
Per gli utenti API, il percorso di migrazione da DALL-E 3 a GPT Image 1.5 è lineare. La struttura degli endpoint è simile, anche se ci sono differenze nei parametri e nei prezzi di cui tenere conto.
GPT-Image-2: il successore imminente
GPT-Image-2 non è stato ancora annunciato ufficialmente, ma a questo punto è un segreto di Pulcinella. Il 4 aprile 2026, un modello corrispondente alle specifiche previste di GPT-Image-2 è apparso su LM Arena (precedentemente LMSYS Chatbot Arena), la piattaforma di benchmark AI basata sul crowdsourcing. I risultati sono stati sorprendenti.
Abbiamo pubblicato una recensione dettagliata basata sui dati di LM Arena e sui test in accesso anticipato: Recensione anteprima GPT-Image-2. I punti salienti:
- 99% di accuratezza nel rendering del testo. Questo è stato il tallone d'Achille della generazione di immagini AI fin dall'inizio. DALL-E 3 riusciva occasionalmente a renderizzare correttamente testi brevi. GPT-Image-2 gestisce paragrafi, loghi e tipografia complessa con una precisione quasi perfetta.
- Eliminazione della dominante cromatica. Uno dei problemi noti di GPT Image 1.5 — la tendenza ad aggiungere tonalità indesiderate alle immagini generate — sembra risolto in GPT-Image-2.
- Output in risoluzione 4K. I modelli precedenti si fermavano a 1024x1024 o risoluzioni simili. GPT-Image-2 genera nativamente fino a 4K, un aspetto importante per la stampa, i display di grande formato e i flussi di lavoro di design professionale.
- Nuova architettura. Sebbene OpenAI non abbia divulgato i dettagli tecnici, il salto qualitativo suggerisce un cambiamento architetturale significativo piuttosto che un miglioramento incrementale rispetto a GPT Image 1.5.
La timeline prevista per il rilascio è tra fine aprile e metà maggio 2026 — tempistica che coincide opportunamente con lo spegnimento di DALL-E, offrendo agli utenti API un chiaro percorso di aggiornamento.
Il cambiamento architetturale: perché è importante
Il passaggio da DALL-E a GPT Image rappresenta più di un aggiornamento di prodotto. È un cambiamento filosofico nel funzionamento della generazione di immagini:
| Architettura DALL-E | Architettura GPT Image |
|---|---|
| Modello di diffusione standalone | Capacità nativa del LLM multimodale |
| Pipeline isolata prompt-immagine | Consapevole del contesto nella conversazione |
| Il prompt testuale è l'unico input | Testo, immagini, cronologia della conversazione e ragionamento informano la generazione |
| Ogni generazione è indipendente | Perfezionamento iterativo all'interno di una sessione |
| Layer di sicurezza/moderazione separato | Sicurezza integrata nel ragionamento del modello |
| Dimensioni di output fisse (1024x1024, ecc.) | Dimensioni di output flessibili fino a 4K |
È lo stesso pattern che abbiamo visto in tutto il settore AI: modelli specializzati monofunzionali che vengono assorbiti da sistemi multimodali generici. La generazione di immagini sta seguendo lo stesso percorso già intrapreso dalla generazione di codice, dall'analisi dati e dalla navigazione web all'interno di ChatGPT.
GPT Image 1.5 vs. DALL-E 3: cosa è cambiato davvero
Per i milioni di utenti che sono stati trasferiti da DALL-E 3 a GPT Image 1.5 a dicembre 2025, il cambiamento non è stato del tutto indolore. Alcune cose sono migliorate. Altre mancano agli utenti. Ecco una valutazione onesta.
Cosa è migliorato in GPT Image 1.5
- Contesto conversazionale. Questo è il miglioramento più grande. DALL-E 3 in ChatGPT usava ChatGPT per riscrivere il prompt prima di inviarlo al modello DALL-E, ma il modello di immagini non aveva alcuna consapevolezza della conversazione. GPT Image 1.5 comprende nativamente il thread. La differenza emerge soprattutto nell'iterazione: "Ora rendilo più minimalista" funziona davvero come ci si aspetta.
- Velocità. GPT Image 1.5 genera immagini sensibilmente più velocemente rispetto a DALL-E 3, soprattutto per richieste di complessità standard.
- Testo nelle immagini. Pur non essendo ancora perfetto (GPT-Image-2 è il vero salto di qualità), GPT Image 1.5 gestisce il rendering del testo meglio di DALL-E 3 nella maggior parte dei casi. Frasi brevi, etichette e cartelli sono più costantemente accurati.
- Aderenza al prompt per scene complesse. Prompt con più soggetti e più azioni che DALL-E 3 ignorava parzialmente vengono gestiti in modo più affidabile da GPT Image 1.5.
- Stile coerente all'interno di una sessione. Poiché il modello mantiene il contesto, generare più immagini nello stesso stile in un'unica conversazione è molto più semplice. Non c'è bisogno di ripetere descrizioni dettagliate dello stile per ogni generazione.
Cosa manca agli utenti di DALL-E 3
- Certi stili artistici. DALL-E 3 aveva un'estetica particolare che alcuni utenti preferivano, soprattutto per output in stile illustrazione. Eccelleva in un look da "illustrazione digitale pulita" che GPT Image 1.5 non replica sempre esattamente.
- Prevedibilità. Il comportamento di DALL-E 3 era più prevedibile in senso stretto — stesso prompt, risultato simile. La consapevolezza del contesto di GPT Image 1.5 significa che può produrre risultati diversi in base alla cronologia della conversazione, il che è generalmente un vantaggio ma occasionalmente una frustrazione.
- Gli endpoint di editing. L'inpainting e l'outpainting di DALL-E 2 erano funzionalità specifiche che non hanno ancora equivalenti diretti nell'API GPT Image. Gli utenti che avevano costruito workflow attorno a queste funzionalità devono trovare approcci alternativi.
- Chiarezza dei prezzi. DALL-E 3 aveva un prezzo per immagine semplice e diretto. Il pricing di GPT Image 1.5 tramite API è basato su token, il che può essere più difficile da prevedere per la pianificazione del budget.
Il bilancio complessivo
Per la maggior parte degli utenti e dei casi d'uso, GPT Image 1.5 è un chiaro miglioramento rispetto a DALL-E 3. Le capacità di contesto conversazionale e perfezionamento iterativo da sole lo rendono lo strumento migliore per chiunque generi immagini come parte di un workflow creativo. Gli utenti più colpiti dalla transizione sono quelli che avevano costruito pipeline di automazione specifiche attorno al comportamento esatto e alla struttura API di DALL-E 3.
GPT-Image-2: il vero successore
Se GPT Image 1.5 è il ponte, GPT-Image-2 è la destinazione. Basandoci sui risultati di LM Arena del 4 aprile e sui report di accesso anticipato, GPT-Image-2 rappresenta un salto generazionale che fa sembrare il ritiro di DALL-E meno una perdita e più una necessaria apertura della strada.
Cosa sappiamo finora
Abbiamo trattato GPT-Image-2 in modo approfondito nella nostra recensione completa, ma ecco i fatti chiave rilevanti nel contesto del ritiro di DALL-E:
- Il rendering del testo è essenzialmente risolto. 99% di accuratezza sul testo nelle immagini. Questa era la lamentela più comune su ogni modello di generazione immagini dalla nascita di DALL-E. GPT-Image-2 gestisce testo su più righe, font diversi, loghi e layout tipografici con fedeltà quasi perfetta.
- Risoluzione nativa 4K. Nessun trucco di upscaling. Il modello genera nativamente fino a 4096x4096. Per il design professionale, la produzione di stampa e i materiali di marketing ad alta risoluzione, questo rimuove una limitazione importante.
- Il problema della dominante cromatica è risolto. GPT Image 1.5 ha una tendenza nota a introdurre tonalità calde o fredde indesiderate. GPT-Image-2 produce colori neutri e accurati per default, pur restando reattivo alle indicazioni cromatiche nei prompt.
- Il fotorealismo raggiunge un nuovo benchmark. I confronti affiancati mostrano che GPT-Image-2 produce output fotorealistici materialmente più difficili da distinguere dalle fotografie rispetto a qualsiasi modello precedente.
- Gamma stilistica. I test preliminari suggeriscono che GPT-Image-2 gestisce una gamma più ampia di stili artistici rispetto a GPT Image 1.5, potenzialmente rispondendo alle lamentele degli utenti che preferivano le capacità illustrative di DALL-E 3.
Disponibilità prevista
OpenAI non ha pubblicato una data di rilascio ufficiale, ma molteplici segnali indicano fine aprile o inizio-metà maggio 2026. La tempistica ha senso strategicamente: annunciare la disponibilità di GPT-Image-2 prima del 12 maggio, dando agli utenti API di DALL-E un motivo convincente per migrare piuttosto che solo una scadenza che li costringe ad abbandonare il vecchio modello.
Per gli utenti API che pianificano la migrazione, il consiglio pratico è: migrare a GPT Image 1.5 ora per assicurare la continuità il 12 maggio, poi passare a GPT-Image-2 quando sarà disponibile.
Il panorama competitivo senza DALL-E
Il ritiro di DALL-E non avviene nel vuoto. Il mercato della generazione di immagini AI nel 2026 è enormemente più competitivo di quando DALL-E 2 fu lanciato nel 2022. Ecco chi trae vantaggio dall'uscita di DALL-E e dove si posiziona il mercato.
Midjourney
Midjourney è stato il principale concorrente di DALL-E nel mercato consumer dal 2022. Con DALL-E fuori gioco, Midjourney diventa il brand standalone di generazione immagini AI più prominente. Il loro modello V7, rilasciato a inizio 2026, produce risultati eccezionali per usi artistici e creativi. Il punto di forza di Midjourney è sempre stato la qualità estetica e la community — hanno costruito una base utenti fedele che non sarebbe mai passata a DALL-E in ogni caso.
Il ritiro di DALL-E potrebbe spingere verso Midjourney alcuni utenti che desiderano uno strumento dedicato alla generazione di immagini piuttosto che un'esperienza integrata in ChatGPT. Ma l'interfaccia Discord-first di Midjourney e la mancanza di un'API completa (la loro web app è ancora relativamente nuova) ne limitano l'attrattiva per sviluppatori e utenti enterprise.
Flux (di Black Forest Labs)
Flux è emerso come leader open-source nella generazione di immagini. Flux Pro e Flux Dev offrono una qualità competitiva con DALL-E 3, e il modello open-source Flux Schnell è diventato il riferimento per gli sviluppatori che vogliono una generazione di immagini veloce e gratuita da eseguire in locale. Il ritiro di DALL-E rafforza la posizione di Flux come alternativa principale per gli sviluppatori che vogliono più controllo sul proprio stack di generazione immagini e non vogliono dipendere dalle decisioni di prodotto di OpenAI.
Ideogram
Ideogram si è ritagliato una nicchia precoce con un rendering del testo nelle immagini superiore — esattamente l'area in cui DALL-E ha sempre faticato. Con GPT-Image-2 che a quanto pare risolve il problema del testo, Ideogram affronta una nuova pressione competitiva dall'alto, ma l'uscita di DALL-E come opzione di fascia media potrebbe spingere più utenti verso i punti di forza specializzati di Ideogram nel design e nella generazione focalizzata sulla tipografia.
Nano Banana Pro e Nano Banana 2
Nano Banana sta guadagnando terreno come opzione veloce e di alta qualità che eccelle nel fotorealismo. Come abbiamo trattato nella nostra recensione comparativa di GPT-Image-2, Nano Banana 2 compete direttamente con GPT-Image-2 su diversi benchmark. L'uscita di DALL-E apre spazio di mercato che Nano Banana è ben posizionato per colmare, in particolare per gli utenti API che vogliono alternative all'ecosistema di OpenAI.
Stable Diffusion (di Stability AI)
Stability AI ha attraversato anni turbolenti, ma Stable Diffusion rimane uno dei modelli di generazione immagini più utilizzati, in particolare nell'ambito open-source e self-hosted. Gli ecosistemi SD3 e SDXL hanno enormi community di modelli fine-tuned e strumenti. Per gli utenti che vogliono la massima personalizzazione, inferenza locale o fine-tuning specializzato, Stable Diffusion continua a essere l'opzione principale. L'uscita di DALL-E non impatta direttamente questo segmento di mercato, ma rafforza la tendenza verso soluzioni completamente integrate (come GPT Image) o completamente aperte (come SD).
Imagen di Google e Gemini
Imagen 3 di Google, disponibile tramite Gemini e l'API Vertex AI, è un altro sistema di generazione immagini integrato in un LLM multimodale. Google sta seguendo un percorso architetturale simile a quello di OpenAI: la generazione di immagini come capacità nativa dell'AI conversazionale piuttosto che come servizio standalone. Il ritiro di DALL-E convalida questo approccio e potrebbe accelerare gli investimenti di Google nelle capacità di generazione immagini di Gemini.
Il quadro generale
L'uscita di DALL-E chiarisce il mercato in tre livelli:
- Piattaforme multimodali integrate (OpenAI GPT Image, Google Gemini/Imagen) — la generazione di immagini come funzionalità di un'AI generica
- Servizi dedicati alla generazione di immagini (Midjourney, Ideogram, Nano Banana) — strumenti specializzati per utenti che danno priorità alla qualità dell'immagine e al controllo creativo
- Open-source e self-hosted (Flux, Stable Diffusion) — massimo controllo e personalizzazione per sviluppatori e aziende con requisiti specifici
DALL-E occupava una posizione intermedia scomoda: un modello di immagini standalone di un'azienda sempre più focalizzata sull'AI multimodale integrata. Il suo ritiro risolve questa tensione.
Implicazioni sulla quota di mercato
Il ritiro di DALL-E redistribuisce una base utenti significativa. Sebbene i numeri esatti non siano pubblici, DALL-E 3 era una delle API di generazione immagini più utilizzate, in particolare tra i clienti enterprise che sceglievano per default l'ecosistema OpenAI per tutte le loro esigenze AI. Questi utenti ora si trovano di fronte a una scelta: restare nell'ecosistema di OpenAI (GPT Image 1.5 / GPT-Image-2), diversificare verso strumenti specializzati, o adottare piattaforme multi-modello che astraggono sopra più provider.
Gli sviluppatori più propensi ad abbandonare completamente l'ecosistema di generazione immagini di OpenAI sono quelli già frustrati dai limiti di DALL-E 3 — in particolare per quanto riguarda il rendering del testo, il controllo artistico e la mancanza di opzioni di fine-tuning. Per questi utenti, la personalizzabilità open-source di Flux o la qualità estetica superiore di Midjourney erano già allettanti. La migrazione forzata rimuove l'inerzia come fattore.
Cosa devono fare gli utenti API prima del 12 maggio: una checklist di migrazione
Se hai un qualsiasi sistema in produzione che chiama l'API di DALL-E 2 o DALL-E 3, il tempo stringe. Ecco un piano di migrazione pratico.
Passo 1: verifica il tuo utilizzo di DALL-E
- Cerca nel tuo codebase i riferimenti ai nomi dei modelli
dall-e-2edall-e-3 - Controlla le chiamate a
/v1/images/generations,/v1/images/editse/v1/images/variations - Esamina i log di utilizzo nella dashboard OpenAI per identificare tutte le applicazioni che consumano endpoint DALL-E
- Controlla gli strumenti no-code/low-code (Zapier, Make, Retool, ecc.) per integrazioni DALL-E
- Verifica i deployment Azure OpenAI se applicabile
Passo 2: comprendi le differenze delle API
- Cambio del nome del modello: aggiorna
"model": "dall-e-3"con l'identificatore del modello GPT Image appropriato - Differenze nei parametri: alcuni parametri specifici di DALL-E (come
quality,style) potrebbero funzionare diversamente o avere valori validi differenti nell'API GPT Image - Formato della risposta: verifica che la struttura della risposta corrisponda alla tua logica di parsing
- Modello di pricing: GPT Image utilizza un pricing basato su token anziché per immagine. Aggiorna di conseguenza il monitoraggio dei costi e il budget
- Rate limit: controlla che i rate limit per i nuovi endpoint corrispondano ai tuoi pattern di utilizzo
Passo 3: aggiorna e testa
- Aggiorna il tuo SDK OpenAI all'ultima versione (le versioni precedenti potrebbero non supportare gli endpoint GPT Image)
- Modifica le chiamate API per puntare al nuovo modello e endpoint
- Esegui la tua suite di prompt esistente su GPT Image 1.5 e confronta gli output
- Testa i casi limite: prompt molto lunghi, prompt con requisiti di stile specifici, prompt che funzionavano bene con l'estetica particolare di DALL-E
- Se utilizzavi gli endpoint di editing o variazione di DALL-E 2, implementa workflow alternativi (GPT Image gestisce l'editing iterativo tramite il contesto conversazionale anziché endpoint dedicati)
Passo 4: gestisci il gap di inpainting/outpainting
Se il tuo prodotto si appoggiava all'endpoint /v1/images/edits di DALL-E 2 per inpainting o outpainting, hai bisogno di un approccio alternativo. Le opzioni includono:
- Utilizzare le capacità di editing conversazionale di GPT Image (descrivi la modifica desiderata in linguaggio naturale)
- Integrare una soluzione alternativa di inpainting (Flux Fill, inpainting Stable Diffusion)
- Attendere GPT-Image-2, che dovrebbe includere capacità di editing più robuste
Passo 5: aggiorna documentazione e comunicazione
- Aggiorna la documentazione del tuo prodotto per riflettere il cambio di modello
- Se il tuo prodotto menziona "Powered by DALL-E" o branding simile, aggiornalo
- Notifica gli utenti se il cambiamento influisce sulla loro esperienza (stile di output diverso, variazioni di prezzo, ecc.)
- Aggiorna i termini di servizio o la privacy policy se fanno riferimento a modelli OpenAI specifici
Passo 6: pianifica per GPT-Image-2
- Migra a GPT Image 1.5 ora per la continuità del 12 maggio
- Progetta la tua integrazione per rendere lo scambio di modello semplice (selezione del modello basata sulla configurazione anziché hardcoded)
- Quando GPT-Image-2 sarà disponibile, testalo rispetto ai tuoi casi d'uso prima di spostare il traffico di produzione
- Considera di offrire agli utenti una scelta tra modelli se i requisiti di qualità del tuo prodotto lo giustificano
La strategia di OpenAI per i prodotti creativi: emerge un pattern
Allargando lo sguardo dal ritiro di DALL-E, emerge un pattern chiaro nelle decisioni di prodotto di OpenAI nell'ultimo anno.
La ritirata dagli strumenti creativi standalone
Marzo 2026: chiusura di Sora. Il modello text-to-video di OpenAI, lanciato con enorme clamore a inizio 2024, è stato ritirato dopo aver faticato con la concorrenza, la struttura dei costi e le preoccupazioni sulla sicurezza. Le capacità di generazione video vengono integrate nell'ecosistema ChatGPT/API anziché mantenute come prodotto separato.
Maggio 2026: chiusura di DALL-E. Il pioniere della generazione di immagini, ritirato a favore della generazione multimodale integrata nei modelli GPT.
Due dei prodotti creativi AI più visibili di OpenAI, scomparsi nell'arco di due mesi. Non è una coincidenza — è strategia.
La tesi dell'integrazione
La scommessa di OpenAI è che le capacità creative hanno più valore come funzionalità di un sistema AI generalistico che come prodotti standalone. Il ragionamento:
- Il contesto conta. Un modello di generazione immagini che comprende la tua conversazione, il tuo progetto e le tue preferenze produce risultati migliori rispetto a uno che vede ogni prompt isolatamente.
- Costi di manutenzione. Gestire modelli separati per testo, immagini, video, codice e altre modalità è costoso e complesso. Consolidare in un'unica architettura multimodale è più efficiente.
- Esperienza utente. Gli utenti non vogliono passare da uno strumento all'altro. Vogliono un'unica interfaccia che gestisca tutto. La popolarità di "GPT, creami un'immagine" all'interno di ChatGPT rispetto all'apertura di uno strumento DALL-E separato lo dimostra.
- Posizionamento competitivo. Il mercato standalone della generazione di immagini è affollato (Midjourney, Flux, Ideogram, Stable Diffusion). Il mercato dell'AI multimodale integrata è meno conteso e più difficile da replicare.
Cosa significa per il settore
La mossa di OpenAI segnala una tendenza più ampia che influenzerà l'intero settore AI:
- Gli strumenti creativi AI standalone subiscono pressioni al consolidamento. Se la più grande azienda AI al mondo ha deciso che i modelli standalone di generazione immagini e video non vale la pena mantenerli separatamente, le aziende più piccole che costruiscono prodotti standalone simili dovrebbero prendere nota.
- Il multimodale è il nuovo standard. Aspettatevi che Google (Gemini), Anthropic (Claude) e altri grandi laboratori AI accelerino le proprie capacità multimodali. L'aspettativa si sta spostando da "la tua AI può generare immagini?" a "la tua AI può generare immagini, video, audio e codice in un'unica conversazione?"
- La stabilità delle API diventa una preoccupazione reale. Gli sviluppatori che hanno costruito su DALL-E sono ora costretti a migrare. Questa esperienza renderà i team più cauti nell'integrazione profonda con un singolo modello e più interessati a layer di astrazione che li isolino dai cambiamenti dei modelli upstream.
- Il vantaggio dell'open-source cresce. Una cosa che Flux e Stable Diffusion possono offrire e che OpenAI non può: non verranno ritirati da una decisione di prodotto aziendale. Per le organizzazioni che necessitano di stabilità a lungo termine, i modelli open-source self-hosted diventano più attrattivi dopo aver visto DALL-E e Sora chiudere.
- I layer di astrazione diventano infrastruttura essenziale. Il ritiro di DALL-E è un caso di studio sul perché l'accoppiamento diretto con un modello è rischioso. Aspettatevi più domanda di middleware e piattaforme di orchestrazione che disaccoppiano le applicazioni da specifici provider di modelli.
La prospettiva di Genra
Saremo brevi perché questo articolo riguarda DALL-E e la strategia di OpenAI, non noi. Ma il ritiro di DALL-E illustra qualcosa su cui abbiamo costruito la nostra piattaforma.
Noi di Genra integriamo diversi modelli di generazione di immagini e video dietro le quinte. Quando crei contenuti tramite Genra, il nostro layer di orchestrazione multi-modello seleziona il miglior modello disponibile per la tua richiesta specifica — considerando fattori come tipo di immagine, requisiti di stile, esigenze di risoluzione e velocità. Quando DALL-E verrà ritirato il 12 maggio, gli utenti Genra non noteranno nulla. Il layer di orchestrazione semplicemente smetterà di inoltrare richieste agli endpoint DALL-E e continuerà a indirizzarle verso GPT Image 1.5, GPT-Image-2 (quando disponibile) e altri modelli nel nostro stack.
Questo è il vantaggio di lavorare a livello di piattaforma piuttosto che direttamente con le API dei singoli modelli. I modelli vanno e vengono. I prodotti vengono ritirati. Le piattaforme che astraggono sopra più modelli offrono una continuità che le integrazioni con un singolo modello non possono garantire.
Punti chiave
- Le API di DALL-E 2 e DALL-E 3 chiudono il 12 maggio 2026. Entrambi gli endpoint smetteranno di accettare richieste. Se hai integrazioni in produzione, la migrazione è obbligatoria, non facoltativa.
- Gli utenti ChatGPT sono già su GPT Image 1.5. La transizione lato consumer è avvenuta a dicembre 2025. Il 12 maggio riguarda principalmente gli utenti API e i deployment Azure OpenAI.
- GPT Image 1.5 è il sostituto immediato. È attivo, disponibile tramite API, ed è un autentico miglioramento in termini di contesto conversazionale e perfezionamento iterativo.
- GPT-Image-2 è in arrivo a breve. Previsto tra fine aprile e metà maggio 2026, con 99% di accuratezza nel rendering del testo, risoluzione 4K e problemi di dominante cromatica risolti. Questo è il vero successore di DALL-E.
- Il cambiamento architetturale va dallo standalone all'integrato. OpenAI sta spostando la generazione di immagini da un modello separato a una capacità nativa dei propri LLM. È lo stesso percorso che Google sta intraprendendo con Gemini/Imagen.
- I ritiri di Sora e DALL-E mostrano una strategia chiara. OpenAI si sta ritirando dagli strumenti creativi standalone a favore di capacità integrate in ChatGPT e nell'API. Aspettatevi che questa tendenza continui.
- Il panorama competitivo avvantaggia tutti gli altri. Midjourney, Flux, Ideogram, Nano Banana e Stable Diffusion guadagnano tutti quota di mercato con l'uscita di DALL-E dallo spazio della generazione immagini standalone.
- La stabilità delle API è una preoccupazione crescente. Due ritiri importanti di modelli in due mesi spingeranno gli sviluppatori verso layer di astrazione e piattaforme multi-modello che isolano dai cambiamenti upstream.
Domande frequenti
Quando chiude esattamente DALL-E?
Le API di DALL-E 2 e DALL-E 3 smetteranno di accettare richieste il 12 maggio 2026. Dopo quella data, qualsiasi chiamata API che specifica un modello DALL-E restituirà un errore. La generazione di immagini di ChatGPT non è interessata, poiché è già passata a GPT Image 1.5 a dicembre 2025.
Le mie immagini generate con DALL-E verranno cancellate?
No. Le immagini che hai già generato con DALL-E sono tue e non verranno rimosse. Il ritiro riguarda solo la possibilità di generare nuove immagini tramite gli endpoint DALL-E. Qualsiasi immagine salvata nella cronologia del tuo account OpenAI o scaricata localmente resta accessibile.
Qual è il sostituto diretto dell'API DALL-E 3?
GPT Image 1.5 è il sostituto attuale, disponibile tramite l'API di OpenAI. GPT-Image-2 dovrebbe essere lanciato tra fine aprile e metà maggio 2026 come ulteriore upgrade. La struttura dell'API è simile ma non identica a DALL-E 3 — sarà necessario aggiornare i nomi dei modelli, verificare le modifiche ai parametri e adeguarsi al pricing basato su token.
GPT Image 1.5 è migliore di DALL-E 3?
Per la maggior parte dei casi d'uso, sì. GPT Image 1.5 offre una migliore consapevolezza del contesto conversazionale, generazione più veloce, rendering del testo migliorato e maggiore aderenza ai prompt complessi. Alcuni utenti rimpiangono l'estetica illustrativa particolare di DALL-E 3 e la prevedibilità dei suoi output. Gli endpoint di editing (inpainting, outpainting, variazioni) di DALL-E 2 non hanno ancora equivalenti diretti.
Cosa è successo a Sora, e c'è un legame con la chiusura di DALL-E?
OpenAI ha chiuso Sora, il suo modello text-to-video, a marzo 2026. Sebbene OpenAI non abbia esplicitamente collegato le due decisioni, seguono lo stesso pattern: ritirare i prodotti creativi AI standalone e integrare quelle capacità in sistemi multimodali all'interno di ChatGPT e dell'API. Entrambe le decisioni riflettono il riorientamento strategico di OpenAI, che si allontana dal mantenimento di modelli separati per ogni modalità creativa.
Anche i deployment DALL-E su Azure OpenAI sono interessati?
Sì. I clienti Azure OpenAI che hanno distribuito DALL-E 2 o DALL-E 3 tramite Azure OpenAI Service sono interessati dalla stessa data di chiusura del 12 maggio 2026. Microsoft ha pubblicato linee guida per la migrazione dei clienti Azure. Consulta la documentazione di Azure OpenAI Service per i percorsi di migrazione e i deployment di modelli alternativi specifici per Azure.
Cosa devo usare se ho bisogno di inpainting o outpainting, dato che gli endpoint DALL-E 2 vengono ritirati?
Hai diverse opzioni: utilizzare l'editing conversazionale di GPT Image 1.5 (descrivi la modifica desiderata in linguaggio naturale), integrare un'alternativa come Flux Fill o l'inpainting di Stable Diffusion per l'uso programmatico, oppure attendere GPT-Image-2 che dovrebbe includere capacità di editing potenziate. L'approccio dipende da se hai bisogno di accesso programmatico a livello API o puoi lavorare con un'interfaccia conversazionale.
Come influisce tutto questo su piattaforme come Genra che utilizzano più modelli AI?
Le piattaforme multi-modello sono le meno colpite dal ritiro di singoli modelli. Piattaforme come Genra che integrano più modelli di generazione immagini dietro le quinte possono reindirizzare automaticamente le richieste quando un modello viene ritirato, assicurando che gli utenti non subiscano alcuna interruzione. Questo è uno dei vantaggi pratici dell'utilizzare un layer di piattaforma anziché integrarsi direttamente con l'API di un singolo modello.
Informazioni sull'autore
Il team di Genra AI copre gli sviluppi nella generazione di immagini e video AI. Segui @GenraAI per aggiornamenti e analisi sul panorama in rapida evoluzione degli strumenti creativi AI.