DALL-E ha muerto: OpenAI retira sus modelos de imagen el 12 de mayo

· Genra AI

OpenAI cierra tanto DALL-E 2 como DALL-E 3 el 12 de mayo de 2026. Junto con el cierre de Sora en marzo, esto marca el fin de dos de los productos creativos de IA mas emblematicos de OpenAI. Los reemplazos ya estan aqui, y son fundamentalmente diferentes a lo que habia antes.

El 12 de mayo de 2026, OpenAI desconectara DALL-E. Tanto DALL-E 2 como DALL-E 3 — los modelos de generacion de imagenes que introdujeron a millones de personas en el arte generado por IA — dejaran de responder a las llamadas de la API. Los endpoints devolveran errores. Los modelos se apagaran.

Esto no es una sorpresa. OpenAI ha estado dando senales de este movimiento durante meses. Los usuarios de ChatGPT fueron migrados automaticamente de DALL-E 3 a GPT Image 1.5 en diciembre de 2025. El aviso de deprecacion de la API salio a principios de 2026. Pero la fecha real de cierre — el 12 de mayo — lo hace tangible de una manera que los avisos de deprecacion no logran.

Lo que hace significativo este momento no es solo la retirada de un producto popular. Es el patron que representa. En marzo de 2026, OpenAI cerro Sora, su modelo de texto a video. Ahora le sigue DALL-E. Dos de las herramientas creativas de IA mas reconocibles de OpenAI, desaparecidas en un lapso de dos meses.

Los reemplazos cuentan una historia sobre hacia donde se dirige la generacion de imagenes con IA. En lugar de modelos independientes y de proposito unico, OpenAI apuesta por la generacion de imagenes integrada directamente en sus modelos de lenguaje de gran escala. GPT Image 1.5 ya esta disponible. GPT-Image-2 es inminente. La arquitectura ha cambiado de forma fundamental.

Este articulo cubre todo lo que necesitas saber: la cronologia completa de la vida y muerte de DALL-E, que es exactamente lo que se retira, que lo reemplaza, como se comparan los reemplazos, y que deben hacer los desarrolladores y empresas antes del 12 de mayo.

La cronologia: El recorrido de DALL-E desde el avance hasta la retirada

DALL-E tuvo uno de los ciclos de vida de producto mas comprimidos en la historia de la IA. Desde el primer articulo de investigacion hasta la retirada completa en poco mas de cinco anos.

Enero de 2021: DALL-E (Original)

OpenAI publico un articulo de investigacion en su blog presentando DALL-E, una version de 12 mil millones de parametros de GPT-3 entrenada para generar imagenes a partir de descripciones de texto. Era una vista previa de investigacion, no un producto. Sin acceso publico. Pero el concepto — escribe una frase, obtiene una imagen — capturo la imaginacion del mundo tecnologico entero. El nombre, un portmanteau de Salvador Dali y WALL-E, se volvio iconico al instante.

El DALL-E original podia generar imagenes a partir de indicaciones como "un sillon con forma de aguacate" o "una ilustracion profesional de alta calidad de un bebe rabano daikon en tutu paseando a un perro". Los resultados eran toscos para los estandares actuales, pero en 2021 parecian ciencia ficcion.

Abril de 2022: DALL-E 2

DALL-E 2 fue la version que lo cambio todo. OpenAI lo lanzo con un sistema de lista de espera que genero una demanda masiva. El modelo usaba una arquitectura basada en difusion (un cambio significativo respecto al enfoque de VAE discreto del original) y producia imagenes de calidad dramaticamente superior a resoluciones mas altas.

DALL-E 2 introdujo funcionalidades clave: inpainting (edicion de partes especificas de una imagen), outpainting (extension de imagenes mas alla de sus bordes originales) y variaciones (generacion de imagenes similares basadas en una referencia subida). Paso de curiosidad academica a producto mainstream. Artistas, disenadores, profesionales del marketing y aficionados inundaron la plataforma.

La API se lanzo mas tarde en 2022, permitiendo a los desarrolladores integrar DALL-E 2 en sus propias aplicaciones. Este fue el comienzo de DALL-E como infraestructura — no solo un juguete para consumidores, sino un componente fundamental para otros productos.

Octubre de 2023: DALL-E 3

DALL-E 3 se integro directamente en ChatGPT, un movimiento que presagiaba la direccion que OpenAI tomaria finalmente. En lugar de requerir que los usuarios visitaran una interfaz separada, DALL-E 3 podia generar imagenes a mitad de una conversacion. Pide a ChatGPT que explique un concepto y luego pide que lo ilustre — todo en el mismo hilo.

La calidad del modelo dio un salto significativo. DALL-E 3 era mucho mejor siguiendo indicaciones complejas, renderizando texto dentro de las imagenes (todavia imperfecto, pero dramaticamente mejorado) y produciendo composiciones coherentes con multiples sujetos. Tambien se lanzo con un sistema de seguridad integrado desarrollado con la capa de moderacion de ChatGPT.

Crucialmente, DALL-E 3 tambien estuvo disponible a traves de la API, manteniendo la compatibilidad retroactiva mientras ofrecia un modelo sustancialmente mas capaz.

2025: Generacion de imagenes con GPT-4o y el principio del fin

La escritura estaba en la pared cuando OpenAI introdujo capacidades nativas de generacion de imagenes dentro de GPT-4o. En lugar de llamar a un modelo DALL-E separado, GPT-4o podia generar imagenes como parte de su propia salida multimodal. Esto no era un envoltorio sobre DALL-E — era una arquitectura fundamentalmente diferente donde la generacion de imagenes era una capacidad nativa del propio modelo de lenguaje.

La calidad era competitiva con DALL-E 3, y la experiencia de usuario era superior. Sin cambio de modo, sin invocacion de modelo separado. Solo una conversacion que podia producir texto, codigo e imagenes de manera fluida.

Diciembre de 2025: GPT Image 1.5 reemplaza a DALL-E 3 en ChatGPT

En diciembre de 2025, OpenAI reemplazo discretamente DALL-E 3 por GPT Image 1.5 como modelo predeterminado de generacion de imagenes en ChatGPT. Los usuarios que habian estado usando DALL-E 3 a traves de ChatGPT fueron migrados automaticamente. Para la mayoria de los usuarios casuales, la transicion fue imperceptible — simplemente notaron que la generacion de imagenes se volvio mas rapida y mas receptiva al contexto conversacional.

Esta fue la senal mas clara de que los dias de DALL-E estaban contados. OpenAI ya habia migrado su producto principal para consumidores fuera del modelo.

Principios de 2026: Anuncio de deprecacion

OpenAI anuncio formalmente que las APIs de DALL-E 2 y DALL-E 3 serian retiradas, con el 12 de mayo de 2026 como fecha de cierre. El anuncio dio a los usuarios de la API aproximadamente cuatro meses para migrar sus integraciones a los nuevos endpoints de GPT Image.

Marzo de 2026: Sora se apaga

Antes de que DALL-E llegara siquiera a su fecha de cierre, OpenAI retiro Sora, su modelo de generacion de texto a video. La justificacion oficial cito la reasignacion de recursos, pero el patron estaba claro: OpenAI se estaba alejando de las herramientas creativas de IA independientes en favor de capacidades integradas dentro de sus productos principales de LLM.

12 de mayo de 2026: DALL-E se apaga

El endpoint deja de responder. Cinco anos y cuatro meses despues del articulo original del blog de DALL-E, la linea de productos queda completamente retirada.

Que es exactamente lo que se retira el 12 de mayo

Seamos especificos sobre lo que deja de funcionar y lo que no.

Lo que se cierra

  • API de DALL-E 2 — El endpoint del modelo dall-e-2 deja de aceptar solicitudes. Cualquier aplicacion que llame a POST /v1/images/generations con "model": "dall-e-2" recibira una respuesta de error.
  • API de DALL-E 3 — El endpoint del modelo dall-e-3 deja de aceptar solicitudes. Lo mismo aplica: cualquier llamada a la API especificando DALL-E 3 como modelo fallara.
  • Endpoints de edicion de imagenes de DALL-E — El endpoint /v1/images/edits (inpainting) que dependia de DALL-E 2 dejara de funcionar.
  • Endpoint de variaciones de DALL-E — El endpoint /v1/images/variations tambien sera retirado.
  • Despliegues de DALL-E en Azure OpenAI — Los clientes de Azure que desplegaron DALL-E 2 o DALL-E 3 a traves de Azure OpenAI Service tambien se veran afectados. Microsoft ha emitido su propia guia de migracion alineada con la fecha del 12 de mayo.

Lo que NO se ve afectado

  • Generacion de imagenes en ChatGPT — ChatGPT ya cambio a GPT Image 1.5 en diciembre de 2025. Si generas imagenes a traves de ChatGPT (web, movil o aplicacion de escritorio), nada cambia para ti el 12 de mayo.
  • Imagenes generadas previamente — Las imagenes que ya has creado con DALL-E son tuyas. No desaparecen. Pero la capacidad de generar nuevas a traves de los endpoints de DALL-E termina.
  • Endpoints de la API de GPT Image — Los endpoints mas nuevos de generacion de imagenes que usan GPT Image 1.5 (y pronto GPT-Image-2) continuan funcionando normalmente.

Impacto en las integraciones existentes

Aqui es donde llega la verdadera disrupcion. Cualquier aplicacion, servicio o flujo de trabajo que haga llamadas directas a la API de DALL-E 2 o DALL-E 3 dejara de funcionar el 12 de mayo a menos que se migre. Esto incluye:

  • Productos SaaS que ofrecen generacion de imagenes con IA impulsada por DALL-E
  • Herramientas de automatizacion de marketing con integraciones de DALL-E
  • Herramientas de diseno y plugins de Figma/Canva que llaman a la API de DALL-E
  • Herramientas internas personalizadas construidas sobre los endpoints de DALL-E
  • Flujos de trabajo no-code/low-code (Zapier, Make, etc.) que hacen referencia a nombres de modelos DALL-E
  • Aplicaciones moviles que usan el SDK de OpenAI con especificaciones de modelos DALL-E

Si mantienes alguno de estos, el 12 de mayo es una fecha limite inamovible.

Que reemplaza a DALL-E: El cambio hacia la generacion integrada en LLMs multimodales

La retirada de DALL-E no es solo un cambio de producto. Representa un cambio arquitectonico fundamental en como OpenAI aborda la generacion de imagenes. El modelo anterior: un sistema especializado de generacion de imagenes que recibe una indicacion de texto y devuelve una imagen. El modelo nuevo: un LLM multimodal que puede generar imagenes como una de sus modalidades de salida nativas, con plena conciencia del contexto de la conversacion.

GPT Image 1.5: El estandar actual

GPT Image 1.5 ha sido el modelo predeterminado de generacion de imagenes en ChatGPT desde diciembre de 2025. Tambien esta disponible a traves de la API. Esto es lo que lo define:

  • Generacion consciente de la conversacion. A diferencia de DALL-E, que trataba cada indicacion como una solicitud aislada, GPT Image 1.5 comprende el contexto completo de la conversacion. Si has estado discutiendo directrices de marca durante 10 mensajes, la imagen que genera refleja toda esa conversacion — no solo la indicacion final.
  • Refinamiento iterativo. Puedes decir "oscurece el fondo" o "mueve el texto a la izquierda" y GPT Image 1.5 entiende a que te refieres. DALL-E requeria que volvieras a describir la imagen completa desde cero en cada iteracion.
  • Generacion mas rapida. GPT Image 1.5 produce resultados notablemente mas rapido que DALL-E 3, particularmente para solicitudes simples.
  • Integrado con razonamiento de texto. Dado que la generacion de imagenes ocurre dentro del propio LLM, el modelo puede razonar sobre que generar antes de generarlo. Esto lleva a una mejor adherencia a indicaciones complejas y con multiples partes.

Para los usuarios de la API, la ruta de migracion de DALL-E 3 a GPT Image 1.5 es directa. La estructura del endpoint es similar, aunque hay diferencias en parametros y precios que deben considerarse.

GPT-Image-2: El sucesor inminente

GPT-Image-2 aun no ha sido anunciado oficialmente, pero es un secreto a voces a estas alturas. El 4 de abril de 2026, un modelo que coincide con las especificaciones esperadas de GPT-Image-2 aparecio en LM Arena (anteriormente LMSYS Chatbot Arena), la plataforma de benchmarks de IA de fuente abierta. Los resultados fueron impactantes.

Hemos publicado una resena detallada basada en los datos de LM Arena y pruebas de acceso anticipado: Resena de la preview de GPT-Image-2. Los puntos destacados:

  • 99% de precision en renderizado de texto. Este ha sido el talon de Aquiles de la generacion de imagenes con IA desde sus inicios. DALL-E 3 podia renderizar correctamente texto corto de vez en cuando. GPT-Image-2 maneja parrafos, logotipos y tipografia compleja con una precision casi perfecta.
  • Eliminacion de dominantes de color. Uno de los problemas conocidos de GPT Image 1.5 — la tendencia a anadir tintes de color no deseados a las imagenes generadas — parece estar resuelto en GPT-Image-2.
  • Salida en resolucion 4K. Los modelos anteriores tenian un tope de 1024x1024 o resoluciones similares. GPT-Image-2 genera de forma nativa a resoluciones de hasta 4K, lo cual importa para impresion, pantallas de gran formato y flujos de trabajo de diseno profesional.
  • Nueva arquitectura. Aunque OpenAI no ha revelado los detalles tecnicos, el salto de calidad sugiere un cambio arquitectonico significativo mas que una mejora incremental sobre GPT Image 1.5.

La fecha de lanzamiento esperada es finales de abril a mediados de mayo de 2026 — convenientemente sincronizada para coincidir con el cierre de DALL-E, dando a los usuarios de la API una razon convincente para migrar en lugar de solo una fecha limite que los obliga a abandonar el modelo antiguo.

El cambio arquitectonico: Por que esto importa

El paso de DALL-E a GPT Image representa mas que una actualizacion de producto. Es un cambio filosofico en como funciona la generacion de imagenes:

Arquitectura DALL-E Arquitectura GPT Image
Modelo de difusion independiente Capacidad nativa de un LLM multimodal
Pipeline aislado de indicacion a imagen Consciente del contexto dentro de la conversacion
La indicacion de texto es la unica entrada Texto, imagenes, historial de conversacion y razonamiento informan la generacion
Cada generacion es independiente Refinamiento iterativo dentro de una sesion
Capa de seguridad/moderacion separada Seguridad integrada en el razonamiento del modelo
Tamanos de salida fijos (1024x1024, etc.) Tamanos de salida flexibles hasta 4K

Este es el mismo patron que hemos visto en toda la IA: modelos especializados y de proposito unico siendo absorbidos por sistemas multimodales de proposito general. La generacion de imagenes sigue el mismo camino que la generacion de codigo, el analisis de datos y la navegacion web ya tomaron dentro de ChatGPT.

GPT Image 1.5 vs. DALL-E 3: Que cambio realmente

Para los millones de usuarios que fueron migrados de DALL-E 3 a GPT Image 1.5 en diciembre de 2025, el cambio no fue completamente imperceptible. Algunas cosas mejoraron. Otras se echan de menos. Aqui va una evaluacion honesta.

Lo que mejoro en GPT Image 1.5

  • Contexto conversacional. Esta es la mayor mejora. DALL-E 3 en ChatGPT usaba ChatGPT para reescribir tu indicacion antes de enviarla al modelo DALL-E, pero el modelo de imagenes en si no tenia conciencia de tu conversacion. GPT Image 1.5 comprende nativamente el hilo. La diferencia se nota sobre todo al iterar: "Ahora hazlo mas minimalista" realmente funciona como se espera.
  • Velocidad. GPT Image 1.5 genera imagenes notablemente mas rapido que DALL-E 3, particularmente para solicitudes de complejidad estandar.
  • Texto en imagenes. Aunque todavia no es perfecto (GPT-Image-2 es el verdadero salto aqui), GPT Image 1.5 maneja el renderizado de texto mejor que DALL-E 3 en la mayoria de los casos. Frases cortas, etiquetas y carteles son mas consistentemente precisos.
  • Adherencia a indicaciones complejas. Indicaciones con multiples sujetos y multiples acciones que DALL-E 3 ignoraba parcialmente son manejadas de manera mas fiable por GPT Image 1.5.
  • Estilo consistente dentro de una sesion. Dado que el modelo mantiene el contexto, generar multiples imagenes en el mismo estilo dentro de una conversacion es mucho mas facil. No necesitas repetir descripciones detalladas de estilo para cada generacion.

Lo que los usuarios echan de menos de DALL-E 3

  • Ciertos estilos artisticos. DALL-E 3 tenia una estetica particular que algunos usuarios preferian, especialmente para resultados de estilo ilustracion. Destacaba en un look de "ilustracion digital limpia" que GPT Image 1.5 no siempre replica exactamente.
  • Previsibilidad. El comportamiento de DALL-E 3 era mas predecible en un sentido estrecho — misma indicacion, resultado similar. La conciencia del contexto de GPT Image 1.5 significa que puede producir resultados diferentes dependiendo del historial de conversacion, lo cual generalmente es un beneficio pero ocasionalmente una frustracion.
  • Los endpoints de edicion. El inpainting y outpainting de DALL-E 2 eran capacidades especificas que aun no tienen equivalentes directos en la API de GPT Image. Los usuarios que construyeron flujos de trabajo alrededor de estas funciones necesitan enfoques alternativos.
  • Claridad en los precios. DALL-E 3 tenia precios sencillos por imagen. Los precios de GPT Image 1.5 a traves de la API se basan en tokens, lo cual puede ser mas dificil de predecir para la planificacion de presupuestos.

La evaluacion final

Para la mayoria de los usuarios y casos de uso, GPT Image 1.5 es una clara mejora sobre DALL-E 3. Las capacidades de contexto conversacional y refinamiento iterativo por si solas lo convierten en la mejor herramienta para cualquiera que genere imagenes como parte de un flujo de trabajo creativo. Los usuarios mas afectados por la transicion son aquellos que construyeron pipelines de automatizacion especificos alrededor del comportamiento exacto y la estructura de la API de DALL-E 3.

GPT-Image-2: El verdadero sucesor

Si GPT Image 1.5 es el puente, GPT-Image-2 es el destino. Basandose en los resultados de LM Arena del 4 de abril y los informes de acceso anticipado, GPT-Image-2 representa un salto generacional que hace que la retirada de DALL-E se sienta menos como una perdida y mas como un despeje necesario del camino.

Lo que sabemos hasta ahora

Hemos cubierto GPT-Image-2 en profundidad en nuestra resena completa, pero aqui estan los datos clave relevantes para el contexto de la retirada de DALL-E:

  • El renderizado de texto esta esencialmente resuelto. 99% de precision en texto dentro de imagenes. Esta era la queja mas comun sobre todos los modelos de generacion de imagenes desde la creacion de DALL-E. GPT-Image-2 maneja texto multilinea, diferentes fuentes, logotipos y disenos tipograficos con una fidelidad casi perfecta.
  • Resolucion nativa 4K. Sin trucos de escalado. El modelo genera de forma nativa a resoluciones de hasta 4096x4096. Para diseno profesional, produccion de impresion y materiales de marketing de alta resolucion, esto elimina una limitacion importante.
  • El problema de la dominante de color esta resuelto. GPT Image 1.5 tiene una tendencia conocida a introducir tintes calidos o frios no deseados. GPT-Image-2 produce colores neutros y precisos de forma predeterminada, manteniendo la capacidad de responder a las indicaciones de color.
  • El fotorrealismo alcanza un nuevo punto de referencia. Las comparaciones lado a lado muestran que GPT-Image-2 produce resultados fotorrealistas que son materialmente mas dificiles de distinguir de fotografias que cualquier modelo anterior.
  • Rango de estilos. Las pruebas tempranas sugieren que GPT-Image-2 maneja una gama mas amplia de estilos artisticos que GPT Image 1.5, abordando potencialmente las quejas de los usuarios que preferian las capacidades de ilustracion de DALL-E 3.

Disponibilidad esperada

OpenAI no ha publicado una fecha de lanzamiento oficial, pero multiples senales apuntan a finales de abril o principios a mediados de mayo de 2026. El momento tiene sentido estrategico: anunciar la disponibilidad de GPT-Image-2 antes del 12 de mayo, dando a los usuarios de la API de DALL-E una razon convincente para migrar en lugar de solo una fecha limite que los obliga a abandonar el modelo antiguo.

Para los usuarios de la API que planifican su migracion, el consejo practico es: migra a GPT Image 1.5 ahora para asegurar la continuidad el 12 de mayo, y luego actualiza a GPT-Image-2 cuando este disponible.

El panorama competitivo sin DALL-E

La retirada de DALL-E no ocurre en el vacio. El mercado de generacion de imagenes con IA en 2026 es vastamente mas competitivo que cuando DALL-E 2 se lanzo por primera vez en 2022. Aqui tienes quien se beneficia de la salida de DALL-E y donde se encuentra el mercado.

Midjourney

Midjourney ha sido el principal competidor de DALL-E en el mercado de consumo desde 2022. Con DALL-E fuera del juego, Midjourney se convierte en la marca independiente de generacion de imagenes con IA mas prominente. Su modelo V7, lanzado a principios de 2026, produce resultados excepcionales para usos artisticos y creativos. La fortaleza de Midjourney siempre ha sido la calidad estetica y la comunidad — han construido una base de usuarios leales que nunca iban a cambiar a DALL-E de todas formas.

La retirada de DALL-E podria empujar a algunos usuarios hacia Midjourney que quieren una herramienta dedicada de generacion de imagenes en lugar de una experiencia integrada de ChatGPT. Pero la interfaz basada en Discord de Midjourney y la falta de una API completa (su aplicacion web es todavia relativamente nueva) limitan su atractivo para desarrolladores y usuarios empresariales.

Flux (de Black Forest Labs)

Flux se ha posicionado como el lider de codigo abierto en generacion de imagenes. Flux Pro y Flux Dev ofrecen una calidad competitiva con DALL-E 3, y el modelo de codigo abierto Flux Schnell se ha convertido en la opcion preferida para los desarrolladores que quieren generacion de imagenes rapida y gratuita que pueden ejecutar localmente. La retirada de DALL-E fortalece la posicion de Flux como la alternativa principal para desarrolladores que quieren mas control sobre su stack de generacion de imagenes y no quieren depender de las decisiones de producto de OpenAI.

Ideogram

Ideogram se labro un nicho tempranamente con un renderizado de texto superior en imagenes — exactamente el area donde DALL-E luchaba constantemente. Con GPT-Image-2 supuestamente resolviendo el problema del texto, Ideogram enfrenta nueva presion competitiva desde arriba, pero la salida de DALL-E como opcion de gama media podria empujar a mas usuarios hacia las fortalezas especializadas de Ideogram en diseno y generacion enfocada en tipografia.

Nano Banana Pro y Nano Banana 2

Nano Banana ha estado ganando traccion como una opcion rapida y de alta calidad que sobresale en fotorrealismo. Como cubrimos en nuestra resena comparativa de GPT-Image-2, Nano Banana 2 compite directamente con GPT-Image-2 en varios benchmarks. La salida de DALL-E abre espacio de mercado que Nano Banana esta bien posicionado para llenar, particularmente para usuarios de API que quieren alternativas al ecosistema de OpenAI.

Stable Diffusion (de Stability AI)

Stability AI ha tenido unos anos turbulentos, pero Stable Diffusion sigue siendo uno de los modelos de generacion de imagenes mas utilizados, particularmente en el espacio de codigo abierto y autoalojamiento. Los ecosistemas SD3 y SDXL tienen comunidades masivas de modelos ajustados y herramientas. Para los usuarios que quieren la maxima personalizacion, inferencia local o ajuste fino especializado, Stable Diffusion sigue siendo la opcion principal. La salida de DALL-E no impacta directamente en este segmento de mercado, pero refuerza la tendencia hacia soluciones completamente integradas (como GPT Image) o completamente abiertas (como SD).

Imagen de Google y Gemini

Imagen 3 de Google, disponible a traves de Gemini y la API de Vertex AI, es otro sistema de generacion de imagenes integrado en un LLM multimodal. Google esta siguiendo un camino arquitectonico similar al de OpenAI: generacion de imagenes como una capacidad nativa de la IA conversacional en lugar de un servicio independiente. La retirada de DALL-E valida este enfoque y podria acelerar la inversion de Google en las capacidades de generacion de imagenes de Gemini.

El panorama general

La salida de DALL-E clarifica el mercado en tres niveles:

  1. Plataformas multimodales integradas (OpenAI GPT Image, Google Gemini/Imagen) — generacion de imagenes como una funcion de una IA de proposito general
  2. Servicios dedicados de generacion de imagenes (Midjourney, Ideogram, Nano Banana) — herramientas especializadas para usuarios que priorizan la calidad de imagen y el control creativo
  3. Codigo abierto y autoalojamiento (Flux, Stable Diffusion) — maximo control y personalizacion para desarrolladores y empresas con requisitos especificos

DALL-E ocupaba un punto intermedio incomodo: un modelo de imagenes independiente de una empresa que se enfocaba cada vez mas en IA multimodal integrada. Su retirada resuelve esa tension.

Implicaciones en la cuota de mercado

La retirada de DALL-E redistribuye una base de usuarios significativa. Aunque los numeros exactos no son publicos, DALL-E 3 era una de las APIs de generacion de imagenes mas utilizadas, particularmente entre clientes empresariales que por defecto usaban el ecosistema de OpenAI para todas sus necesidades de IA. Esos usuarios ahora enfrentan una decision: permanecer dentro del ecosistema de OpenAI (GPT Image 1.5 / GPT-Image-2), diversificar hacia herramientas especializadas, o adoptar plataformas multi-modelo que abstraigan sobre multiples proveedores.

Los desarrolladores con mas probabilidades de abandonar completamente el ecosistema de generacion de imagenes de OpenAI son aquellos que ya estaban frustrados con las limitaciones de DALL-E 3 — particularmente en renderizado de texto, control artistico y la falta de opciones de ajuste fino. Para estos usuarios, la personalizacion de codigo abierto de Flux o la salida estetica superior de Midjourney ya eran tentadoras. La migracion forzada elimina la inercia como factor.

Lo que los usuarios de la API deben hacer antes del 12 de mayo: Lista de verificacion de migracion

Si tienes algun sistema en produccion que llama a la API de DALL-E 2 o DALL-E 3, el reloj esta corriendo. Aqui tienes un plan practico de migracion.

Paso 1: Audita tu uso de DALL-E

  • Busca en tu codigo base referencias a los nombres de modelo dall-e-2 y dall-e-3
  • Verifica las llamadas a /v1/images/generations, /v1/images/edits y /v1/images/variations
  • Revisa los registros de uso en tu panel de OpenAI para identificar todas las aplicaciones que consumen endpoints de DALL-E
  • Verifica las herramientas no-code/low-code (Zapier, Make, Retool, etc.) en busca de integraciones con DALL-E
  • Audita los despliegues de Azure OpenAI si corresponde

Paso 2: Comprende las diferencias de la API

  • Cambio de nombre del modelo: Actualiza "model": "dall-e-3" al identificador de modelo GPT Image correspondiente
  • Diferencias en parametros: Algunos parametros especificos de DALL-E (como quality, style) pueden funcionar de manera diferente o tener valores validos distintos en la API de GPT Image
  • Formato de respuesta: Verifica que la estructura de la respuesta coincida con tu logica de procesamiento
  • Modelo de precios: GPT Image usa precios basados en tokens en lugar de precios por imagen. Actualiza tu seguimiento de costos y presupuesto en consecuencia
  • Limites de tasa: Verifica que tus limites de tasa para los nuevos endpoints coincidan con tus patrones de uso

Paso 3: Actualiza y prueba

  • Actualiza tu SDK de OpenAI a la ultima version (las versiones anteriores pueden no ser compatibles con los endpoints de GPT Image)
  • Modifica las llamadas de la API para apuntar al nuevo modelo y endpoint
  • Ejecuta tu conjunto de indicaciones existente contra GPT Image 1.5 y compara los resultados
  • Prueba casos extremos: indicaciones muy largas, indicaciones con requisitos de estilo especificos, indicaciones que funcionaban bien con la estetica particular de DALL-E
  • Si usabas los endpoints de edicion o variacion de DALL-E 2, implementa flujos de trabajo alternativos (GPT Image maneja la edicion iterativa a traves del contexto de conversacion en lugar de endpoints dedicados)

Paso 4: Gestiona la brecha de inpainting/outpainting

Si tu producto dependia del endpoint /v1/images/edits de DALL-E 2 para inpainting u outpainting, necesitas un enfoque alternativo. Las opciones incluyen:

  • Usar las capacidades de edicion conversacional de GPT Image (describe la edicion que quieres en lenguaje natural)
  • Integrar una solucion alternativa de inpainting (Flux Fill, inpainting de Stable Diffusion)
  • Esperar a GPT-Image-2, que se espera incluya capacidades de edicion mas robustas

Paso 5: Actualiza la documentacion y la comunicacion

  • Actualiza la documentacion de tu producto para reflejar el cambio de modelo
  • Si tu producto menciona "Impulsado por DALL-E" o una marca similar, actualizalo
  • Notifica a los usuarios si el cambio afecta su experiencia (diferente estilo de salida, cambios de precios, etc.)
  • Actualiza tus terminos de servicio o politica de privacidad si hacen referencia a modelos especificos de OpenAI

Paso 6: Planifica para GPT-Image-2

  • Migra a GPT Image 1.5 ahora para asegurar la continuidad el 12 de mayo
  • Disena tu integracion para facilitar el cambio de modelo (seleccion de modelo basada en configuracion en lugar de codificada directamente)
  • Cuando GPT-Image-2 se lance, pruebalo contra tus casos de uso antes de redirigir el trafico de produccion
  • Considera ofrecer a los usuarios la opcion de elegir entre modelos si los requisitos de calidad de tu producto lo justifican

La estrategia de productos creativos de OpenAI: Emerge un patron

Si nos alejamos de la retirada de DALL-E, emerge un patron claro en las decisiones de producto de OpenAI durante el ultimo ano.

La retirada de las herramientas creativas independientes

Marzo de 2026: Sora se apago. El modelo de texto a video de OpenAI, que se lanzo con una enorme expectativa a principios de 2024, fue retirado tras luchar con la competencia, la estructura de costos y las preocupaciones de seguridad. Las capacidades de generacion de video estan siendo incorporadas al ecosistema de ChatGPT/API en lugar de mantenerse como un producto separado.

Mayo de 2026: DALL-E se apaga. El pionero de la generacion de imagenes, retirado en favor de la generacion multimodal integrada dentro de los modelos GPT.

Dos de los productos creativos de IA mas visibles publicamente de OpenAI, desaparecidos en dos meses. Esto no es una coincidencia — es una estrategia.

La tesis de la integracion

La apuesta de OpenAI es que las capacidades creativas son mas valiosas como funciones de un sistema de IA de proposito general que como productos independientes. El razonamiento:

  • El contexto importa. Un modelo de generacion de imagenes que comprende tu conversacion, tu proyecto y tus preferencias produce mejores resultados que uno que ve cada indicacion de forma aislada.
  • Costo de mantenimiento. Ejecutar modelos separados para texto, imagenes, video, codigo y otras modalidades es costoso y complejo. Consolidar en una unica arquitectura multimodal es mas eficiente.
  • Experiencia de usuario. Los usuarios no quieren cambiar de contexto entre herramientas. Quieren una sola interfaz que lo maneje todo. La popularidad de "GPT, hazme una imagen" dentro de ChatGPT versus abrir una herramienta DALL-E separada lo demuestra.
  • Posicionamiento competitivo. El mercado de generacion de imagenes independiente esta saturado (Midjourney, Flux, Ideogram, Stable Diffusion). El mercado de IA multimodal integrada esta menos disputado y es mas dificil de replicar.

Lo que esto significa para la industria

El movimiento de OpenAI senala una tendencia mas amplia que afectara a toda la industria de la IA:

  • Las herramientas creativas de IA independientes enfrentan presion de consolidacion. Si la empresa de IA mas grande del mundo decidio que los modelos independientes de generacion de imagenes y video no valen la pena mantener por separado, las empresas mas pequenas que construyen productos independientes similares deberian tomar nota.
  • Lo multimodal es la nueva linea base. Espera que Google (Gemini), Anthropic (Claude) y otros grandes laboratorios de IA aceleren sus propias capacidades multimodales. La expectativa esta cambiando de "puede tu IA generar imagenes?" a "puede tu IA generar imagenes, video, audio y codigo dentro de una sola conversacion?"
  • La estabilidad de las APIs se convierte en una preocupacion real. Los desarrolladores que construyeron sobre DALL-E ahora se ven obligados a migrar. Esta experiencia hara que los equipos sean mas cautelosos con la integracion profunda con cualquier modelo unico, y mas interesados en capas de abstraccion que los aislen de cambios de modelo ascendentes.
  • La ventaja del codigo abierto crece. Algo que Flux y Stable Diffusion pueden ofrecer y que OpenAI no puede: no seran retirados por una decision de producto corporativa. Para las organizaciones que necesitan estabilidad a largo plazo, los modelos de codigo abierto autoalojados se vuelven mas atractivos despues de ver como DALL-E y Sora fueron cerrados.
  • Las capas de abstraccion se convierten en infraestructura esencial. La retirada de DALL-E es un caso de estudio de por que el acoplamiento directo a un modelo es arriesgado. Espera mas demanda de middleware y plataformas de orquestacion que desacoplen las aplicaciones de proveedores de modelos especificos.

La perspectiva de Genra

Seremos breves porque este articulo trata sobre DALL-E y la estrategia de OpenAI, no sobre nosotros. Pero la retirada de DALL-E ilustra algo alrededor de lo cual hemos construido nuestra plataforma.

En Genra, integramos multiples modelos de generacion de imagenes y video entre bastidores. Cuando creas contenido a traves de Genra, nuestra capa de orquestacion multi-modelo selecciona el mejor modelo disponible para tu solicitud especifica — considerando factores como el tipo de imagen, los requisitos de estilo, las necesidades de resolucion y la velocidad. Cuando DALL-E se retire el 12 de mayo, los usuarios de Genra no notaran nada. La capa de orquestacion simplemente dejara de enviar solicitudes a los endpoints de DALL-E y continuara enviandolas a GPT Image 1.5, GPT-Image-2 (cuando este disponible) y otros modelos en nuestro stack.

Esta es la ventaja de trabajar a nivel de plataforma en lugar de directamente con las APIs de modelos individuales. Los modelos van y vienen. Los productos se retiran. Las plataformas que abstraen sobre multiples modelos proporcionan una continuidad que las integraciones con un solo modelo no pueden ofrecer.

Puntos clave

  • Las APIs de DALL-E 2 y DALL-E 3 se cierran el 12 de mayo de 2026. Ambos endpoints dejaran de aceptar solicitudes. Si tienes integraciones en produccion, la migracion es obligatoria, no opcional.
  • Los usuarios de ChatGPT ya estan en GPT Image 1.5. La transicion para el consumidor final ocurrio en diciembre de 2025. El 12 de mayo afecta principalmente a los usuarios de la API y a los despliegues de Azure OpenAI.
  • GPT Image 1.5 es el reemplazo inmediato. Esta disponible, accesible a traves de la API y es una mejora genuina en terminos de contexto conversacional y refinamiento iterativo.
  • GPT-Image-2 llega de forma inminente. Se espera a finales de abril o mediados de mayo de 2026, con 99% de precision en renderizado de texto, resolucion 4K y problemas de dominante de color resueltos. Este es el verdadero sucesor de DALL-E.
  • El cambio arquitectonico va de independiente a integrado. OpenAI esta moviendo la generacion de imagenes de un modelo separado a una capacidad nativa de sus LLMs. Este es el mismo camino que Google esta tomando con Gemini/Imagen.
  • Las retiradas de Sora + DALL-E muestran una estrategia clara. OpenAI se esta alejando de las herramientas creativas independientes en favor de capacidades integradas dentro de ChatGPT y la API. Espera que esta tendencia continue.
  • El panorama competitivo beneficia a todos los demas. Midjourney, Flux, Ideogram, Nano Banana y Stable Diffusion ganan cuota de mercado conforme DALL-E sale del espacio de generacion de imagenes independiente.
  • La estabilidad de las APIs es una preocupacion creciente. Dos retiradas importantes de modelos en dos meses empujaran a los desarrolladores hacia capas de abstraccion y plataformas multi-modelo que los aislen de cambios ascendentes.

Preguntas frecuentes

Cuando se cierra exactamente DALL-E?

Las APIs de DALL-E 2 y DALL-E 3 dejaran de aceptar solicitudes el 12 de mayo de 2026. Despues de esa fecha, cualquier llamada a la API que especifique un modelo DALL-E devolvera un error. La generacion de imagenes de ChatGPT no se ve afectada, ya que hizo la transicion a GPT Image 1.5 en diciembre de 2025.

Se eliminaran mis imagenes ya generadas con DALL-E?

No. Las imagenes que ya has generado con DALL-E son tuyas y no seran eliminadas. La retirada solo afecta a la capacidad de generar nuevas imagenes a traves de los endpoints de DALL-E. Cualquier imagen almacenada en el historial de tu cuenta de OpenAI o descargada localmente sigue siendo accesible.

Cual es el reemplazo directo de la API de DALL-E 3?

GPT Image 1.5 es el reemplazo actual, disponible a traves de la API de OpenAI. Se espera que GPT-Image-2 se lance a finales de abril o mediados de mayo de 2026 como una mejora adicional. La estructura de la API es similar pero no identica a la de DALL-E 3 — necesitaras actualizar los nombres de modelo, revisar los cambios de parametros y ajustar los precios basados en tokens.

Es GPT Image 1.5 mejor que DALL-E 3?

Para la mayoria de los casos de uso, si. GPT Image 1.5 ofrece mejor conciencia del contexto conversacional, generacion mas rapida, renderizado de texto mejorado y mayor adherencia a indicaciones complejas. Algunos usuarios echan de menos la estetica particular de ilustracion de DALL-E 3 y la previsibilidad de sus resultados. Los endpoints de edicion (inpainting, outpainting, variaciones) de DALL-E 2 aun no tienen equivalentes directos.

Que paso con Sora y esta relacionado con el cierre de DALL-E?

OpenAI cerro Sora, su modelo de texto a video, en marzo de 2026. Aunque OpenAI no ha vinculado explicitamente ambas decisiones, siguen el mismo patron: retirar productos creativos de IA independientes e incorporar esas capacidades en sistemas multimodales integrados dentro de ChatGPT y la API. Ambas decisiones reflejan el cambio estrategico de OpenAI alejandose del mantenimiento de modelos separados para cada modalidad creativa.

Se ven afectados tambien los despliegues de DALL-E en Azure OpenAI?

Si. Los clientes de Azure OpenAI que desplegaron DALL-E 2 o DALL-E 3 a traves de Azure OpenAI Service se ven afectados por la misma fecha de cierre del 12 de mayo de 2026. Microsoft ha emitido una guia de migracion para clientes de Azure. Consulta la documentacion de Azure OpenAI Service para conocer las rutas de migracion especificas de Azure y los despliegues de modelos alternativos.

Que debo usar si necesito inpainting u outpainting, dado que los endpoints de DALL-E 2 se retiran?

Tienes varias opciones: usar la edicion conversacional de GPT Image 1.5 (describe la edicion que quieres en lenguaje natural), integrar una alternativa como Flux Fill o el inpainting de Stable Diffusion para uso programatico, o esperar a GPT-Image-2, que se espera incluya capacidades de edicion mejoradas. El enfoque depende de si necesitas acceso programatico a nivel de API o puedes trabajar dentro de una interfaz conversacional.

Como afecta esto a plataformas como Genra que usan multiples modelos de IA?

Las plataformas multi-modelo son las menos afectadas por las retiradas de modelos individuales. Plataformas como Genra que integran multiples modelos de generacion de imagenes entre bastidores pueden redirigir automaticamente las solicitudes cuando un modelo se retira, asegurando que los usuarios no experimenten ninguna interrupcion. Esta es una de las ventajas practicas de usar una capa de plataforma en lugar de integrarse directamente con la API de un solo modelo.


Sobre el autor
El equipo de Genra AI cubre los avances en generacion de imagenes y video con IA. Sigue a @GenraAI para actualizaciones y analisis sobre el panorama en rapida evolucion de las herramientas creativas de IA.