DALL-E morreu: OpenAI aposenta seus modelos de imagem em 12 de maio

· Genra AI

A OpenAI vai encerrar tanto o DALL-E 2 quanto o DALL-E 3 em 12 de maio de 2026. Somado ao encerramento do Sora em março, isso marca o fim de dois dos produtos criativos de IA mais icônicos da OpenAI. Os substitutos já estão aqui — e são fundamentalmente diferentes do que existia antes.

Em 12 de maio de 2026, a OpenAI vai desligar o DALL-E. Tanto o DALL-E 2 quanto o DALL-E 3 — os modelos de geração de imagens que apresentaram milhões de pessoas à arte gerada por IA — vão parar de responder a chamadas de API. Os endpoints vão retornar erros. Os modelos vão ficar no escuro.

Isso não é surpresa. A OpenAI vem sinalizando esse movimento há meses. Os usuários do ChatGPT já foram migrados automaticamente do DALL-E 3 para o GPT Image 1.5 em dezembro de 2025. O aviso de descontinuação da API saiu no início de 2026. Mas a data real do encerramento — 12 de maio — torna tudo mais concreto de uma forma que avisos de descontinuação não conseguem.

O que torna esse momento significativo não é apenas a aposentadoria de um produto popular. É o padrão que ele representa. Em março de 2026, a OpenAI encerrou o Sora, seu modelo de texto para vídeo. Agora o DALL-E segue o mesmo caminho. Duas das ferramentas criativas de IA mais reconhecíveis da OpenAI, eliminadas em menos de dois meses.

Os substitutos contam uma história sobre para onde a geração de imagens por IA está caminhando. Em vez de modelos autônomos e com propósito único, a OpenAI está apostando na geração de imagens integrada diretamente aos seus grandes modelos de linguagem. O GPT Image 1.5 já está no ar. O GPT-Image-2 está prestes a chegar. A arquitetura mudou fundamentalmente.

Este artigo cobre tudo que você precisa saber: o cronograma completo da vida e morte do DALL-E, o que exatamente está sendo aposentado, o que o substitui, como os substitutos se comparam, e o que desenvolvedores e empresas precisam fazer antes de 12 de maio.

O Cronograma: A Jornada do DALL-E de Revolução a Aposentadoria

O DALL-E teve um dos ciclos de vida de produto mais compactos da história da IA. Do primeiro artigo de pesquisa à aposentadoria completa em pouco mais de cinco anos.

Janeiro de 2021: DALL-E (Original)

A OpenAI publicou um post de blog de pesquisa apresentando o DALL-E, uma versão de 12 bilhões de parâmetros do GPT-3 treinada para gerar imagens a partir de descrições textuais. Era uma prévia de pesquisa, não um produto. Sem acesso público. Mas o conceito — digite uma frase, receba uma imagem — capturou a imaginação de todo o mundo da tecnologia. O nome, uma junção de Salvador Dalí e WALL-E, se tornou instantaneamente icônico.

O DALL-E original conseguia gerar imagens a partir de prompts como "uma poltrona em formato de abacate" ou "uma ilustração profissional de alta qualidade de um bebê nabo daikon de tutu passeando com um cachorro." Os resultados eram rudimentares pelos padrões de hoje, mas em 2021 pareciam ficção científica.

Abril de 2022: DALL-E 2

O DALL-E 2 foi a versão que mudou tudo. A OpenAI o lançou com um sistema de lista de espera que gerou uma demanda gigantesca. O modelo usava uma arquitetura baseada em difusão (uma mudança significativa em relação à abordagem de VAE discreto do original) e produzia imagens de qualidade dramaticamente superior em resoluções mais altas.

O DALL-E 2 introduziu recursos-chave: inpainting (edição de partes específicas de uma imagem), outpainting (extensão de imagens além de suas bordas originais) e variações (geração de imagens semelhantes com base em uma referência carregada). Passou de curiosidade de pesquisa para produto mainstream. Artistas, designers, profissionais de marketing e entusiastas lotaram a plataforma.

A API foi lançada depois, em 2022, permitindo que desenvolvedores integrassem o DALL-E 2 em suas próprias aplicações. Esse foi o início do DALL-E como infraestrutura — não apenas um brinquedo para consumidores, mas um bloco de construção para outros produtos.

Outubro de 2023: DALL-E 3

O DALL-E 3 foi integrado diretamente ao ChatGPT, um movimento que prenunciava a direção que a OpenAI acabaria tomando. Em vez de exigir que os usuários acessassem uma interface separada, o DALL-E 3 podia gerar imagens no meio de uma conversa. Peça ao ChatGPT para explicar um conceito, depois peça para ilustrar esse conceito — tudo na mesma thread.

A qualidade do modelo deu um salto significativo. O DALL-E 3 era muito melhor em seguir prompts complexos, renderizar texto dentro de imagens (ainda imperfeito, mas dramaticamente melhorado) e produzir composições coerentes com múltiplos elementos. Ele também foi lançado com um sistema de segurança integrado desenvolvido com a camada de moderação do ChatGPT.

De forma crucial, o DALL-E 3 também foi disponibilizado através da API, mantendo compatibilidade retroativa enquanto oferecia um modelo substancialmente mais capaz.

2025: Geração de Imagens do GPT-4o e o Começo do Fim

O destino já estava selado quando a OpenAI introduziu capacidades nativas de geração de imagens no GPT-4o. Em vez de chamar um modelo DALL-E separado, o GPT-4o podia gerar imagens como parte de sua própria saída multimodal. Isso não era um wrapper em cima do DALL-E — era uma arquitetura fundamentalmente diferente, onde a geração de imagens era uma capacidade nativa do próprio modelo de linguagem.

A qualidade era competitiva com o DALL-E 3, e a experiência do usuário era superior. Sem troca de modo, sem invocação de modelo separado. Apenas uma conversa que podia produzir texto, código e imagens de forma fluida.

Dezembro de 2025: GPT Image 1.5 Substitui o DALL-E 3 no ChatGPT

Em dezembro de 2025, a OpenAI silenciosamente substituiu o DALL-E 3 pelo GPT Image 1.5 como modelo padrão de geração de imagens no ChatGPT. Os usuários que usavam o DALL-E 3 através do ChatGPT foram migrados automaticamente. Para a maioria dos usuários casuais, a transição foi imperceptível — eles simplesmente notaram que a geração de imagens ficou mais rápida e mais responsiva ao contexto da conversa.

Esse foi o sinal mais claro de que os dias do DALL-E estavam contados. A OpenAI já havia tirado seu produto principal para consumidores do modelo.

Início de 2026: Anúncio de Descontinuação

A OpenAI anunciou formalmente que as APIs do DALL-E 2 e do DALL-E 3 seriam aposentadas, com 12 de maio de 2026 como data de encerramento. O anúncio deu aos usuários da API aproximadamente quatro meses para migrar suas integrações para os novos endpoints do GPT Image.

Março de 2026: Sora É Encerrado

Antes mesmo do DALL-E chegar à sua data de encerramento, a OpenAI aposentou o Sora, seu modelo de geração de texto para vídeo. A justificativa oficial citou redirecionamento de recursos, mas o padrão era claro: a OpenAI estava recuando das ferramentas criativas de IA autônomas em favor de capacidades integradas dentro de seus produtos LLM principais.

12 de Maio de 2026: DALL-E Se Apaga

O endpoint para de responder. Cinco anos e quatro meses depois do post original do blog sobre o DALL-E, a linha de produtos está totalmente aposentada.

O Que Exatamente Está Sendo Aposentado em 12 de Maio

Vamos ser específicos sobre o que para de funcionar e o que não para.

O Que Será Encerrado

  • API do DALL-E 2 — O endpoint do modelo dall-e-2 para de aceitar requisições. Qualquer aplicação chamando POST /v1/images/generations com "model": "dall-e-2" receberá uma resposta de erro.
  • API do DALL-E 3 — O endpoint do modelo dall-e-3 para de aceitar requisições. O mesmo se aplica: qualquer chamada de API especificando DALL-E 3 como modelo vai falhar.
  • Endpoints de edição de imagem do DALL-E — O endpoint /v1/images/edits (inpainting) que dependia do DALL-E 2 não funcionará mais.
  • Endpoint de variações do DALL-E — O endpoint /v1/images/variations também está sendo aposentado.
  • Implantações do DALL-E no Azure OpenAI — Clientes do Azure que implantaram o DALL-E 2 ou DALL-E 3 através do Azure OpenAI Service também serão afetados. A Microsoft emitiu sua própria orientação de migração alinhada com a data de 12 de maio.

O Que NÃO É Afetado

  • Geração de imagens no ChatGPT — O ChatGPT já mudou para o GPT Image 1.5 em dezembro de 2025. Se você gera imagens pelo ChatGPT (web, mobile ou app desktop), nada muda para você em 12 de maio.
  • Imagens já geradas — As imagens que você já criou com o DALL-E são suas. Elas não desaparecem. Mas a capacidade de gerar novas imagens pelos endpoints do DALL-E acaba.
  • Endpoints da API do GPT Image — Os endpoints mais recentes de geração de imagens que usam o GPT Image 1.5 (e em breve o GPT-Image-2) continuam funcionando normalmente.

Impacto nas Integrações Existentes

É aqui que a disrupção real acontece. Qualquer aplicação, serviço ou fluxo de trabalho que faz chamadas diretas à API do DALL-E 2 ou DALL-E 3 vai quebrar em 12 de maio, a menos que seja migrado. Isso inclui:

  • Produtos SaaS que oferecem geração de imagens por IA alimentada pelo DALL-E
  • Ferramentas de automação de marketing com integrações DALL-E
  • Ferramentas de design e plugins do Figma/Canva que chamam a API do DALL-E
  • Ferramentas internas customizadas construídas sobre os endpoints do DALL-E
  • Fluxos de trabalho no-code/low-code (Zapier, Make, etc.) que referenciam nomes de modelo DALL-E
  • Apps mobile usando o SDK da OpenAI com especificações de modelo DALL-E

Se você mantém qualquer um desses, 12 de maio é um prazo inegociável.

O Que Substitui o DALL-E: A Mudança para Geração Integrada em LLMs Multimodais

A aposentadoria do DALL-E não é apenas uma troca de produto. Representa uma mudança arquitetural fundamental na forma como a OpenAI aborda a geração de imagens. O modelo antigo: um sistema especializado de geração de imagens que recebe um prompt de texto e retorna uma imagem. O novo modelo: um LLM multimodal que pode gerar imagens como uma de suas modalidades nativas de saída, com plena consciência do contexto da conversa.

GPT Image 1.5: O Padrão Atual

O GPT Image 1.5 é o modelo padrão de geração de imagens no ChatGPT desde dezembro de 2025. Ele também está disponível através da API. Veja o que o define:

  • Geração com consciência de conversa. Diferentemente do DALL-E, que tratava cada prompt como uma requisição isolada, o GPT Image 1.5 entende o contexto completo da conversa. Se você passou 10 mensagens discutindo diretrizes de marca, a imagem gerada reflete toda essa conversa — não apenas o prompt final.
  • Refinamento iterativo. Você pode dizer "escureça o fundo" ou "mova o texto para a esquerda" e o GPT Image 1.5 entende a que você está se referindo. O DALL-E exigia que você redescrevesse a imagem inteira do zero a cada iteração.
  • Geração mais rápida. O GPT Image 1.5 produz resultados perceptivelmente mais rápidos que o DALL-E 3, especialmente para requisições simples.
  • Integrado com raciocínio textual. Como a geração de imagem acontece dentro do próprio LLM, o modelo pode raciocinar sobre o que gerar antes de gerar. Isso leva a uma melhor aderência a prompts complexos e com múltiplas partes.

Para usuários da API, o caminho de migração do DALL-E 3 para o GPT Image 1.5 é direto. A estrutura do endpoint é semelhante, embora existam diferenças nos parâmetros e preços que precisam ser consideradas.

GPT-Image-2: O Sucessor Iminente

O GPT-Image-2 ainda não foi anunciado oficialmente, mas a essa altura já é um segredo aberto. Em 4 de abril de 2026, um modelo correspondendo às especificações esperadas do GPT-Image-2 apareceu no LM Arena (anteriormente LMSYS Chatbot Arena), a plataforma de benchmark de IA colaborativa. Os resultados foram impressionantes.

Publicamos uma análise detalhada com base nos dados do LM Arena e testes de acesso antecipado: Review do GPT-Image-2. Os destaques:

  • 99% de precisão na renderização de texto. Esse tem sido o calcanhar de Aquiles da geração de imagens por IA desde o início. O DALL-E 3 conseguia ocasionalmente renderizar texto curto corretamente. O GPT-Image-2 lida com parágrafos, logos e tipografia complexa com precisão quase perfeita.
  • Eliminação de dominante de cor. Um dos problemas conhecidos do GPT Image 1.5 — a tendência de adicionar tonalidades de cor indesejadas às imagens geradas — parece estar resolvido no GPT-Image-2.
  • Saída em resolução 4K. Modelos anteriores atingiam no máximo 1024x1024 ou resoluções similares. O GPT-Image-2 gera nativamente em até 4K, o que importa para impressão, displays de grande formato e fluxos de trabalho de design profissional.
  • Nova arquitetura. Embora a OpenAI não tenha divulgado os detalhes técnicos, o salto de qualidade sugere uma mudança arquitetural significativa, e não uma melhoria incremental sobre o GPT Image 1.5.

A previsão de lançamento é final de abril a meados de maio de 2026 — convenientemente programado para coincidir com o encerramento do DALL-E, dando aos usuários da API um caminho claro de atualização.

A Mudança Arquitetural: Por Que Isso Importa

A transição do DALL-E para o GPT Image representa mais do que uma atualização de produto. É uma mudança filosófica na forma como a geração de imagens funciona:

Arquitetura do DALL-E Arquitetura do GPT Image
Modelo de difusão autônomo Capacidade nativa de LLM multimodal
Pipeline isolado de prompt para imagem Consciente do contexto dentro da conversa
O prompt de texto é a única entrada Texto, imagens, histórico de conversa e raciocínio informam a geração
Cada geração é independente Refinamento iterativo dentro de uma sessão
Camada separada de segurança/moderação Segurança integrada ao raciocínio do modelo
Tamanhos de saída fixos (1024x1024, etc.) Tamanhos de saída flexíveis até 4K

Esse é o mesmo padrão que temos visto em toda a IA: modelos especializados de propósito único sendo absorvidos por sistemas multimodais de propósito geral. A geração de imagens está seguindo o mesmo caminho que a geração de código, análise de dados e navegação web já trilharam dentro do ChatGPT.

GPT Image 1.5 vs. DALL-E 3: O Que Realmente Mudou

Para os milhões de usuários que foram migrados do DALL-E 3 para o GPT Image 1.5 em dezembro de 2025, a mudança não foi totalmente imperceptível. Algumas coisas melhoraram. Outras, os usuários sentem falta. Aqui vai uma avaliação honesta.

O Que Melhorou no GPT Image 1.5

  • Contexto conversacional. Essa é a maior melhoria. O DALL-E 3 no ChatGPT usava o ChatGPT para reescrever seu prompt antes de enviá-lo ao modelo DALL-E, mas o modelo de imagem em si não tinha consciência da sua conversa. O GPT Image 1.5 entende nativamente a thread. A diferença aparece mais quando você está iterando: "Agora deixe mais minimalista" realmente funciona como esperado.
  • Velocidade. O GPT Image 1.5 gera imagens perceptivelmente mais rápido que o DALL-E 3, especialmente para requisições de complexidade padrão.
  • Texto em imagens. Embora ainda não seja perfeito (o GPT-Image-2 é o verdadeiro salto aqui), o GPT Image 1.5 lida com renderização de texto melhor que o DALL-E 3 na maioria dos casos. Frases curtas, rótulos e placas são mais consistentemente precisos.
  • Aderência a prompts para cenas complexas. Prompts com múltiplos sujeitos e múltiplas ações que o DALL-E 3 parcialmente ignoraria são tratados de forma mais confiável pelo GPT Image 1.5.
  • Estilo consistente dentro de uma sessão. Como o modelo mantém o contexto, gerar múltiplas imagens no mesmo estilo dentro de uma conversa é muito mais fácil. Você não precisa repetir descrições detalhadas de estilo para cada geração.

O Que os Usuários Sentem Falta do DALL-E 3

  • Certos estilos artísticos. O DALL-E 3 tinha uma estética particular que alguns usuários preferiam, especialmente para saídas em estilo de ilustração. Ele se destacava em um visual de "ilustração digital limpa" que o GPT Image 1.5 nem sempre replica com exatidão.
  • Previsibilidade. O comportamento do DALL-E 3 era mais previsível em um sentido restrito — mesmo prompt, resultado semelhante. A consciência de contexto do GPT Image 1.5 significa que ele pode produzir resultados diferentes dependendo do histórico da conversa, o que geralmente é um benefício, mas ocasionalmente uma frustração.
  • Os endpoints de edição. O inpainting e outpainting do DALL-E 2 eram capacidades específicas que não têm equivalentes diretos na API do GPT Image ainda. Usuários que construíram fluxos de trabalho em torno desses recursos precisam de abordagens alternativas.
  • Clareza de preços. O DALL-E 3 tinha preços diretos por imagem. O preço do GPT Image 1.5 pela API é baseado em tokens, o que pode ser mais difícil de prever para fins de orçamento.

O Balanço Final

Para a maioria dos usuários e casos de uso, o GPT Image 1.5 é uma atualização clara em relação ao DALL-E 3. As capacidades de contexto conversacional e refinamento iterativo por si só já o tornam a melhor ferramenta para quem gera imagens como parte de um fluxo de trabalho criativo. Os usuários mais afetados pela transição são aqueles que construíram pipelines de automação específicos baseados no comportamento exato e na estrutura de API do DALL-E 3.

GPT-Image-2: O Verdadeiro Sucessor

Se o GPT Image 1.5 é a ponte, o GPT-Image-2 é o destino. Com base nos resultados do LM Arena de 4 de abril e nos relatos de acesso antecipado, o GPT-Image-2 representa um salto geracional que faz a aposentadoria do DALL-E parecer menos uma perda e mais uma necessária limpeza do caminho.

O Que Sabemos Até Agora

Cobrimos o GPT-Image-2 em profundidade em nossa análise completa, mas aqui estão os fatos-chave relevantes para o contexto da aposentadoria do DALL-E:

  • A renderização de texto está essencialmente resolvida. 99% de precisão em texto dentro de imagens. Essa era a reclamação mais comum sobre todos os modelos de geração de imagens desde o início do DALL-E. O GPT-Image-2 lida com texto multilinha, diferentes fontes, logos e layouts tipográficos com fidelidade quase perfeita.
  • Resolução nativa 4K. Sem truques de upscaling. O modelo gera nativamente em até 4096x4096. Para design profissional, produção gráfica e materiais de marketing em alta resolução, isso remove uma limitação importante.
  • O problema da dominante de cor foi corrigido. O GPT Image 1.5 tem uma tendência conhecida de introduzir tonalidades quentes ou frias indesejadas. O GPT-Image-2 produz cores neutras e precisas por padrão, mantendo-se responsivo a direcionamentos de cor nos prompts.
  • O fotorrealismo atinge um novo patamar. Comparações lado a lado mostram o GPT-Image-2 produzindo saídas fotorrealistas que são materialmente mais difíceis de distinguir de fotografias do que qualquer modelo anterior.
  • Variedade de estilos. Testes iniciais sugerem que o GPT-Image-2 lida com uma gama mais ampla de estilos artísticos que o GPT Image 1.5, potencialmente atendendo às reclamações de usuários que preferiam as capacidades de ilustração do DALL-E 3.

Disponibilidade Esperada

A OpenAI não publicou uma data oficial de lançamento, mas múltiplos sinais apontam para final de abril ou início a meados de maio de 2026. O timing faz sentido estratégico: anunciar a disponibilidade do GPT-Image-2 antes de 12 de maio, dando aos usuários da API do DALL-E uma razão convincente para migrar, e não apenas um prazo forçando-os a sair do modelo antigo.

Para usuários da API planejando sua migração, o conselho prático é: migre para o GPT Image 1.5 agora para garantir continuidade em 12 de maio, depois atualize para o GPT-Image-2 quando estiver disponível.

O Cenário Competitivo Sem o DALL-E

A aposentadoria do DALL-E não acontece no vácuo. O mercado de geração de imagens por IA em 2026 é imensamente mais competitivo do que quando o DALL-E 2 foi lançado em 2022. Veja quem se beneficia da saída do DALL-E e onde o mercado se encontra.

Midjourney

O Midjourney tem sido o principal concorrente do DALL-E no mercado de consumidores desde 2022. Com o DALL-E fora do jogo, o Midjourney se torna a marca autônoma de geração de imagens por IA mais proeminente. Seu modelo V7, lançado no início de 2026, produz resultados excepcionais para casos de uso artísticos e criativos. A força do Midjourney sempre foi a qualidade estética e a comunidade — eles construíram uma base de usuários fiéis que nunca iria mudar para o DALL-E de qualquer forma.

A aposentadoria do DALL-E pode empurrar alguns usuários para o Midjourney que querem uma ferramenta dedicada de geração de imagens em vez de uma experiência integrada ao ChatGPT. Mas a interface baseada no Discord do Midjourney e a falta de uma API completa (seu app web ainda é relativamente novo) limitam seu apelo para desenvolvedores e usuários corporativos.

Flux (by Black Forest Labs)

O Flux emergiu como líder open-source na geração de imagens. O Flux Pro e o Flux Dev oferecem qualidade competitiva com o DALL-E 3, e o modelo open-source Flux Schnell se tornou a referência para desenvolvedores que querem geração de imagens rápida e gratuita que podem rodar localmente. A aposentadoria do DALL-E fortalece a posição do Flux como alternativa principal para desenvolvedores que querem mais controle sobre sua stack de geração de imagens e não querem depender das decisões de produto da OpenAI.

Ideogram

O Ideogram conquistou um nicho cedo com renderização de texto superior em imagens — exatamente a área onde o DALL-E consistentemente tinha dificuldades. Com o GPT-Image-2 supostamente resolvendo o problema do texto, o Ideogram enfrenta nova pressão competitiva vinda de cima, mas a saída do DALL-E como opção intermediária pode empurrar mais usuários para os pontos fortes especializados do Ideogram em design e geração focada em tipografia.

Nano Banana Pro e Nano Banana 2

O Nano Banana vem ganhando tração como uma opção rápida e de alta qualidade que se destaca no fotorrealismo. Como cobrimos em nosso review comparativo do GPT-Image-2, o Nano Banana 2 compete diretamente com o GPT-Image-2 em vários benchmarks. A saída do DALL-E abre espaço de mercado que o Nano Banana está bem posicionado para preencher, especialmente para usuários de API que querem alternativas ao ecossistema da OpenAI.

Stable Diffusion (by Stability AI)

A Stability AI passou por alguns anos turbulentos, mas o Stable Diffusion continua sendo um dos modelos de geração de imagens mais amplamente utilizados, especialmente no espaço open-source e self-hosted. Os ecossistemas SD3 e SDXL têm comunidades massivas de modelos ajustados e ferramentas. Para usuários que querem máxima personalização, inferência local ou fine-tuning especializado, o Stable Diffusion continua sendo a opção principal. A saída do DALL-E não impacta diretamente esse segmento de mercado, mas reforça a tendência em direção a soluções totalmente integradas (como o GPT Image) ou totalmente abertas (como o SD).

Imagen e Gemini do Google

O Imagen 3 do Google, disponível através do Gemini e da API Vertex AI, é outro sistema de geração de imagens integrado a LLM multimodal. O Google está seguindo um caminho arquitetural semelhante ao da OpenAI: geração de imagens como capacidade nativa da IA conversacional, não como um serviço autônomo. A aposentadoria do DALL-E valida essa abordagem e pode acelerar o investimento do Google nas capacidades de imagem do Gemini.

O Panorama Geral

A saída do DALL-E clarifica o mercado em três camadas:

  1. Plataformas multimodais integradas (OpenAI GPT Image, Google Gemini/Imagen) — geração de imagens como recurso de uma IA de propósito geral
  2. Serviços dedicados de geração de imagens (Midjourney, Ideogram, Nano Banana) — ferramentas especializadas para usuários que priorizam qualidade de imagem e controle criativo
  3. Open-source e self-hosted (Flux, Stable Diffusion) — máximo controle e personalização para desenvolvedores e empresas com requisitos específicos

O DALL-E ocupava um meio-termo desconfortável: um modelo de imagem autônomo de uma empresa cada vez mais focada em IA multimodal integrada. Sua aposentadoria resolve essa tensão.

Implicações de Market Share

A aposentadoria do DALL-E redistribui uma base significativa de usuários. Embora os números exatos não sejam públicos, o DALL-E 3 era uma das APIs de geração de imagens mais amplamente usadas, especialmente entre clientes corporativos que usavam o ecossistema da OpenAI por padrão para todas as suas necessidades de IA. Esses usuários agora enfrentam uma escolha: permanecer no ecossistema da OpenAI (GPT Image 1.5 / GPT-Image-2), diversificar para ferramentas especializadas, ou adotar plataformas multi-modelo que abstraem sobre múltiplos provedores.

Os desenvolvedores com maior probabilidade de sair completamente do ecossistema de geração de imagens da OpenAI são aqueles que já estavam frustrados com as limitações do DALL-E 3 — especialmente em relação à renderização de texto, controle artístico e falta de opções de fine-tuning. Para esses usuários, a personalização open-source do Flux ou a saída estética superior do Midjourney já eram tentadoras. A migração forçada remove a inércia como fator.

O Que Usuários da API Precisam Fazer Antes de 12 de Maio: Checklist de Migração

Se você tem qualquer sistema em produção que chama a API do DALL-E 2 ou DALL-E 3, o relógio está correndo. Aqui vai um plano prático de migração.

Passo 1: Audite Seu Uso do DALL-E

  • Pesquise sua base de código por referências aos nomes de modelo dall-e-2 e dall-e-3
  • Verifique chamadas para /v1/images/generations, /v1/images/edits e /v1/images/variations
  • Revise os logs de uso no seu painel da OpenAI para identificar todas as aplicações consumindo endpoints do DALL-E
  • Verifique ferramentas no-code/low-code (Zapier, Make, Retool, etc.) quanto a integrações com DALL-E
  • Audite implantações do Azure OpenAI, se aplicável

Passo 2: Entenda as Diferenças da API

  • Mudança de nome do modelo: Atualize "model": "dall-e-3" para o identificador de modelo GPT Image apropriado
  • Diferenças de parâmetros: Alguns parâmetros específicos do DALL-E (como quality, style) podem funcionar de forma diferente ou ter valores válidos diferentes na API do GPT Image
  • Formato de resposta: Verifique se a estrutura de resposta é compatível com sua lógica de parsing
  • Modelo de preços: O GPT Image usa preços baseados em tokens em vez de preços por imagem. Atualize seu rastreamento de custos e orçamento conforme necessário
  • Limites de taxa: Verifique se seus rate limits para os novos endpoints correspondem aos seus padrões de uso

Passo 3: Atualize e Teste

  • Atualize seu SDK da OpenAI para a versão mais recente (versões mais antigas podem não suportar os endpoints do GPT Image)
  • Modifique as chamadas de API para apontar para o novo modelo e endpoint
  • Execute seu conjunto existente de prompts contra o GPT Image 1.5 e compare os resultados
  • Teste casos extremos: prompts muito longos, prompts com requisitos específicos de estilo, prompts que funcionavam bem com a estética particular do DALL-E
  • Se você usava os endpoints de edição ou variação do DALL-E 2, implemente fluxos de trabalho alternativos (o GPT Image lida com edição iterativa através do contexto da conversa em vez de endpoints dedicados)

Passo 4: Resolva a Lacuna de Inpainting/Outpainting

Se seu produto dependia do endpoint /v1/images/edits do DALL-E 2 para inpainting ou outpainting, você precisa de uma abordagem alternativa. As opções incluem:

  • Usar as capacidades de edição conversacional do GPT Image (descreva a edição que você quer em linguagem natural)
  • Integrar uma solução alternativa de inpainting (Flux Fill, inpainting do Stable Diffusion)
  • Aguardar o GPT-Image-2, que deve incluir capacidades de edição mais robustas

Passo 5: Atualize Documentação e Comunicação

  • Atualize a documentação do seu produto para refletir a mudança de modelo
  • Se seu produto menciona "Powered by DALL-E" ou branding semelhante, atualize-o
  • Notifique os usuários se a mudança afetar a experiência deles (estilo de saída diferente, mudanças de preço, etc.)
  • Atualize seus termos de serviço ou política de privacidade se eles referenciam modelos específicos da OpenAI

Passo 6: Planeje para o GPT-Image-2

  • Migre para o GPT Image 1.5 agora para garantir continuidade em 12 de maio
  • Projete sua integração para facilitar a troca de modelos (seleção de modelo baseada em configuração em vez de hardcoded)
  • Quando o GPT-Image-2 for lançado, teste-o com seus casos de uso antes de direcionar tráfego de produção
  • Considere oferecer aos usuários a escolha entre modelos se os requisitos de qualidade do seu produto justificarem

A Estratégia de Produtos Criativos da OpenAI: Um Padrão Emerge

Afaste o zoom da aposentadoria do DALL-E e um padrão claro emerge nas decisões de produto da OpenAI no último ano.

O Recuo das Ferramentas Criativas Autônomas

Março de 2026: Sora encerrado. O modelo de texto para vídeo da OpenAI, que foi lançado com enorme hype no início de 2024, foi aposentado após enfrentar dificuldades com concorrência, estrutura de custos e preocupações de segurança. As capacidades de geração de vídeo estão sendo incorporadas ao ecossistema ChatGPT/API em vez de mantidas como produto separado.

Maio de 2026: DALL-E encerrado. O pioneiro da geração de imagens, aposentado em favor da geração multimodal integrada nos modelos GPT.

Dois dos produtos criativos de IA mais publicamente visíveis da OpenAI, desaparecidos em dois meses. Isso não é coincidência — é estratégia.

A Tese da Integração

A aposta da OpenAI é que capacidades criativas são mais valiosas como recursos de um sistema de IA de propósito geral do que como produtos autônomos. O raciocínio:

  • O contexto importa. Um modelo de geração de imagens que entende sua conversa, seu projeto e suas preferências produz resultados melhores do que um que vê cada prompt isoladamente.
  • Custo de manutenção. Manter modelos separados para texto, imagens, vídeo, código e outras modalidades é caro e complexo. Consolidar em uma única arquitetura multimodal é mais eficiente.
  • Experiência do usuário. Os usuários não querem alternar entre ferramentas. Eles querem uma interface que cuide de tudo. A popularidade do "GPT, me faça uma imagem" dentro do ChatGPT versus abrir uma ferramenta DALL-E separada prova isso.
  • Posicionamento competitivo. O mercado autônomo de geração de imagens é lotado (Midjourney, Flux, Ideogram, Stable Diffusion). O mercado de IA multimodal integrada é menos disputado e mais difícil de replicar.

O Que Isso Significa para a Indústria

O movimento da OpenAI sinaliza uma tendência mais ampla que afetará toda a indústria de IA:

  • Ferramentas criativas de IA autônomas enfrentam pressão de consolidação. Se a maior empresa de IA do mundo decidiu que modelos autônomos de geração de imagens e vídeo não valem a pena manter separadamente, empresas menores construindo produtos autônomos semelhantes devem prestar atenção.
  • Multimodal é o novo padrão. Espere que Google (Gemini), Anthropic (Claude) e outros grandes laboratórios de IA acelerem suas próprias capacidades multimodais. A expectativa está mudando de "sua IA consegue gerar imagens?" para "sua IA consegue gerar imagens, vídeo, áudio e código dentro de uma única conversa?"
  • Estabilidade de API se torna uma preocupação real. Desenvolvedores que construíram em cima do DALL-E agora são forçados a migrar. Essa experiência vai tornar as equipes mais cautelosas sobre integração profunda com qualquer modelo específico, e mais interessadas em camadas de abstração que as isolem de mudanças upstream.
  • A vantagem do open-source cresce. Uma coisa que Flux e Stable Diffusion podem oferecer que a OpenAI não pode: eles não serão aposentados por uma decisão de produto corporativa. Para organizações que precisam de estabilidade a longo prazo, modelos open-source self-hosted se tornam mais atraentes depois de ver DALL-E e Sora serem encerrados.
  • Camadas de abstração se tornam infraestrutura essencial. A aposentadoria do DALL-E é um estudo de caso sobre por que o acoplamento direto a modelos é arriscado. Espere mais demanda por middleware e plataformas de orquestração que desacoplem aplicações de provedores de modelos específicos.

Perspectiva da Genra

Seremos breves porque este artigo é sobre o DALL-E e a estratégia da OpenAI, não sobre nós. Mas a aposentadoria do DALL-E ilustra algo em torno do qual construímos nossa plataforma.

Na Genra, integramos múltiplos modelos de geração de imagens e vídeo nos bastidores. Quando você cria conteúdo através da Genra, nossa camada de orquestração multi-modelo seleciona o melhor modelo disponível para sua requisição específica — considerando fatores como tipo de imagem, requisitos de estilo, necessidades de resolução e velocidade. Quando o DALL-E for aposentado em 12 de maio, os usuários da Genra não vão perceber nada. A camada de orquestração simplesmente vai parar de rotear para os endpoints do DALL-E e continuar roteando para o GPT Image 1.5, GPT-Image-2 (quando disponível) e outros modelos em nossa stack.

Essa é a vantagem de trabalhar no nível de plataforma em vez de diretamente com APIs de modelos individuais. Modelos vêm e vão. Produtos são aposentados. As plataformas que abstraem sobre múltiplos modelos proporcionam continuidade que integrações com modelo único não conseguem.

Principais Conclusões

  • As APIs do DALL-E 2 e DALL-E 3 encerram em 12 de maio de 2026. Ambos os endpoints vão parar de aceitar requisições. Se você tem integrações em produção, a migração é obrigatória, não opcional.
  • Usuários do ChatGPT já estão no GPT Image 1.5. A transição voltada para o consumidor aconteceu em dezembro de 2025. 12 de maio afeta principalmente usuários de API e implantações do Azure OpenAI.
  • O GPT Image 1.5 é o substituto imediato. Está ativo, está disponível pela API, e é uma atualização genuína em termos de contexto conversacional e refinamento iterativo.
  • O GPT-Image-2 está chegando em breve. Previsto para final de abril a meados de maio de 2026, com 99% de renderização de texto, resolução 4K e problemas de dominante de cor resolvidos. Este é o verdadeiro sucessor do DALL-E.
  • A mudança arquitetural é de autônomo para integrado. A OpenAI está movendo a geração de imagens de um modelo separado para uma capacidade nativa de seus LLMs. Este é o mesmo caminho que o Google está seguindo com o Gemini/Imagen.
  • Os encerramentos do Sora + DALL-E mostram uma estratégia clara. A OpenAI está recuando das ferramentas criativas autônomas em favor de capacidades integradas dentro do ChatGPT e da API. Espere que essa tendência continue.
  • O cenário competitivo beneficia todos os outros. Midjourney, Flux, Ideogram, Nano Banana e Stable Diffusion ganham participação de mercado com a saída do DALL-E do espaço de geração de imagens autônoma.
  • Estabilidade de API é uma preocupação crescente. Duas grandes aposentadorias de modelo em dois meses vão empurrar desenvolvedores em direção a camadas de abstração e plataformas multi-modelo que isolam contra mudanças upstream.

Perguntas Frequentes

Quando exatamente o DALL-E será encerrado?

As APIs do DALL-E 2 e DALL-E 3 vão parar de aceitar requisições em 12 de maio de 2026. Após essa data, qualquer chamada de API especificando um modelo DALL-E retornará um erro. A geração de imagens no ChatGPT não é afetada, pois já fez a transição para o GPT Image 1.5 em dezembro de 2025.

Minhas imagens já geradas pelo DALL-E serão deletadas?

Não. As imagens que você já gerou com o DALL-E são suas e não serão removidas. A aposentadoria afeta apenas a capacidade de gerar novas imagens pelos endpoints do DALL-E. Quaisquer imagens armazenadas no histórico da sua conta OpenAI ou baixadas localmente permanecem acessíveis.

Qual é o substituto direto da API do DALL-E 3?

O GPT Image 1.5 é o substituto atual, disponível pela API da OpenAI. O GPT-Image-2 deve ser lançado entre final de abril e meados de maio de 2026 como uma atualização adicional. A estrutura da API é semelhante, mas não idêntica à do DALL-E 3 — você precisará atualizar os nomes dos modelos, revisar mudanças nos parâmetros e se ajustar ao preço baseado em tokens.

O GPT Image 1.5 é melhor que o DALL-E 3?

Para a maioria dos casos de uso, sim. O GPT Image 1.5 oferece melhor consciência de contexto conversacional, geração mais rápida, renderização de texto aprimorada e aderência mais forte a prompts complexos. Alguns usuários sentem falta da estética particular de ilustração do DALL-E 3 e da previsibilidade de seus resultados. Os endpoints de edição (inpainting, outpainting, variações) do DALL-E 2 ainda não têm equivalentes diretos.

O que aconteceu com o Sora e está relacionado ao encerramento do DALL-E?

A OpenAI encerrou o Sora, seu modelo de texto para vídeo, em março de 2026. Embora a OpenAI não tenha explicitamente vinculado as duas decisões, elas seguem o mesmo padrão: aposentar produtos criativos de IA autônomos e incorporar essas capacidades em sistemas multimodais integrados dentro do ChatGPT e da API. Ambas as decisões refletem a mudança estratégica da OpenAI em direção ao abandono da manutenção de modelos separados para cada modalidade criativa.

As implantações do DALL-E no Azure OpenAI também são afetadas?

Sim. Clientes do Azure OpenAI que implantaram o DALL-E 2 ou DALL-E 3 pelo Azure OpenAI Service são afetados pela mesma data de encerramento de 12 de maio de 2026. A Microsoft emitiu orientação de migração para clientes Azure. Consulte a documentação do Azure OpenAI Service para caminhos de migração específicos do Azure e implantações de modelos alternativos.

O que devo usar se preciso de inpainting ou outpainting, já que esses endpoints do DALL-E 2 estão sendo aposentados?

Você tem várias opções: usar a edição conversacional do GPT Image 1.5 (descreva a edição que você quer em linguagem natural), integrar uma alternativa como Flux Fill ou inpainting do Stable Diffusion para uso programático, ou aguardar o GPT-Image-2 que deve incluir capacidades aprimoradas de edição. A abordagem depende de você precisar de acesso programático via API ou poder trabalhar dentro de uma interface conversacional.

Como isso afeta plataformas como a Genra que usam múltiplos modelos de IA?

Plataformas multi-modelo são as menos afetadas por aposentadorias individuais de modelos. Plataformas como a Genra que integram múltiplos modelos de geração de imagens nos bastidores podem automaticamente redirecionar requisições quando um modelo é aposentado, garantindo que os usuários não experimentem nenhuma interrupção. Esse é um dos benefícios práticos de usar uma camada de plataforma em vez de integrar diretamente com a API de um único modelo.


Sobre o Autor
A equipe da Genra AI cobre desenvolvimentos em geração de imagens e vídeo por IA. Siga @GenraAI para atualizações e análises sobre o cenário de ferramentas criativas de IA em rápida evolução.