DALL-E 종료: OpenAI가 5월 12일에 이미지 모델을 폐지 — 대체 모델 총정리

· Genra AI

OpenAI가 2026년 5월 12일부로 DALL-E 2와 DALL-E 3를 동시에 종료합니다. 3월 Sora 종료와 맞물려, OpenAI를 대표하던 크리에이티브 AI 제품 두 가지가 사라지게 됩니다. 대체 모델은 이미 출시되었으며, 기존과는 근본적으로 다른 방식으로 작동합니다.

2026년 5월 12일, OpenAI가 DALL-E의 플러그를 뽑습니다. 수백만 명에게 AI 생성 이미지를 처음 소개한 DALL-E 2와 DALL-E 3 — 두 모델 모두 API 호출에 응답하지 않게 됩니다. 엔드포인트는 오류를 반환하고, 모델은 완전히 가동을 멈춥니다.

이번 결정이 갑작스러운 것은 아닙니다. OpenAI는 수개월 전부터 신호를 보내왔습니다. ChatGPT 사용자들은 이미 2025년 12월에 DALL-E 3에서 GPT Image 1.5로 자동 전환되었고, API 지원 중단 공지는 2026년 초에 발표되었습니다. 하지만 실제 종료일인 5월 12일이 확정되면서, 지원 중단 공지와는 차원이 다른 현실감을 안겨줍니다.

이 시점이 중요한 이유는 단순히 인기 제품의 퇴역 때문만이 아닙니다. 하나의 패턴을 보여주기 때문입니다. 2026년 3월, OpenAI는 텍스트-투-비디오 모델인 Sora를 종료했습니다. 이제 DALL-E가 그 뒤를 따릅니다. OpenAI에서 가장 인지도 높은 크리에이티브 AI 도구 두 가지가 두 달 만에 사라지는 셈입니다.

대체 모델을 보면 AI 이미지 생성이 어디로 향하고 있는지 알 수 있습니다. 독립형 단일 목적 모델 대신, OpenAI는 대규모 언어 모델에 직접 통합된 이미지 생성에 투자하고 있습니다. GPT Image 1.5는 이미 서비스 중이고, GPT-Image-2 출시도 임박했습니다. 아키텍처 자체가 근본적으로 바뀌었습니다.

이 글에서는 DALL-E의 탄생과 종료까지의 전체 타임라인, 정확히 무엇이 퇴역되는지, 대체 모델은 무엇인지, 비교 분석, 그리고 개발자와 기업이 5월 12일 전에 해야 할 일까지 총정리합니다.

타임라인: 혁신에서 퇴역까지, DALL-E의 여정

DALL-E는 AI 역사상 가장 압축적인 제품 수명 주기를 가졌습니다. 첫 연구 논문에서 완전한 퇴역까지 불과 5년여 만의 일입니다.

2021년 1월: 오리지널 DALL-E

OpenAI가 DALL-E를 소개하는 연구 블로그를 발표했습니다. 텍스트 설명으로 이미지를 생성하도록 훈련된 120억 파라미터 규모의 GPT-3 변형 모델이었습니다. 제품이 아닌 연구 프리뷰였고, 공개 접근도 불가능했습니다. 하지만 문장을 입력하면 이미지가 나온다는 개념이 전 세계 테크 업계의 상상력을 사로잡았습니다. 살바도르 달리(Salvador Dali)와 월-E(WALL-E)를 합친 이름은 즉시 상징적인 존재가 되었습니다.

오리지널 DALL-E는 "아보카도 모양의 안락의자"나 "튜튜를 입고 강아지를 산책시키는 아기 무" 같은 프롬프트로 이미지를 생성할 수 있었습니다. 오늘날 기준으로 보면 조잡했지만, 2021년 당시에는 공상과학처럼 느껴졌습니다.

2022년 4월: DALL-E 2

DALL-E 2는 모든 것을 바꿔놓은 버전이었습니다. OpenAI는 대기자 명단 방식으로 출시해 폭발적인 수요를 이끌어냈습니다. 이 모델은 디퓨전 기반 아키텍처(오리지널의 이산 VAE 방식과는 완전히 다른 접근)를 사용했으며, 훨씬 높은 해상도에서 극적으로 향상된 품질의 이미지를 생성했습니다.

DALL-E 2는 인페인팅(이미지 특정 부분 편집), 아웃페인팅(이미지를 원래 경계 너머로 확장), 변형(업로드한 참조 이미지 기반 유사 이미지 생성) 같은 핵심 기능을 도입했습니다. 연구 프로젝트에서 대중 제품으로 도약한 것입니다. 아티스트, 디자이너, 마케터, 취미 사용자들이 플랫폼으로 몰려들었습니다.

2022년 말에는 API가 출시되어 개발자들이 DALL-E 2를 자체 애플리케이션에 통합할 수 있게 되었습니다. DALL-E가 단순한 소비자 장난감이 아니라 인프라, 즉 다른 제품을 만드는 빌딩 블록이 된 시작점이었습니다.

2023년 10월: DALL-E 3

DALL-E 3는 ChatGPT에 직접 통합되었는데, 이는 OpenAI가 궁극적으로 나아갈 방향을 예고한 행보였습니다. 사용자가 별도의 인터페이스를 방문하는 대신, DALL-E 3가 대화 중간에 이미지를 생성할 수 있었습니다. ChatGPT에 개념 설명을 요청한 뒤, 같은 대화에서 그 개념의 일러스트레이션을 요청할 수 있었습니다.

모델 품질도 크게 향상되었습니다. DALL-E 3는 복잡한 프롬프트 해석, 이미지 내 텍스트 렌더링(여전히 불완전했지만 극적으로 개선), 여러 피사체가 포함된 일관된 구도 생성에 훨씬 뛰어났습니다. ChatGPT의 모더레이션 레이어와 함께 개발된 내장 안전 시스템도 탑재되었습니다.

결정적으로, DALL-E 3는 API를 통해서도 제공되어 하위 호환성을 유지하면서 실질적으로 더 강력한 모델을 제공했습니다.

2025년: GPT-4o 이미지 생성과 종료의 시작

OpenAI가 GPT-4o에 네이티브 이미지 생성 기능을 도입했을 때 이미 결말이 보였습니다. 별도의 DALL-E 모델을 호출하는 대신, GPT-4o가 자체 멀티모달 출력의 일부로 이미지를 생성할 수 있었습니다. DALL-E를 감싼 래퍼가 아니었습니다 — 이미지 생성이 언어 모델 자체의 네이티브 기능인, 근본적으로 다른 아키텍처였습니다.

품질은 DALL-E 3에 필적했고, 사용자 경험은 더 뛰어났습니다. 모드 전환이나 별도 모델 호출 없이, 텍스트, 코드, 이미지를 자연스럽게 오가는 대화가 가능해졌습니다.

2025년 12월: GPT Image 1.5, ChatGPT에서 DALL-E 3 대체

2025년 12월, OpenAI는 조용히 ChatGPT의 기본 이미지 생성 모델을 DALL-E 3에서 GPT Image 1.5로 교체했습니다. ChatGPT를 통해 DALL-E 3를 사용하던 사용자들은 자동으로 마이그레이션되었습니다. 대부분의 일반 사용자에게 전환은 매끄러웠습니다 — 이미지 생성이 빨라지고 대화 맥락에 더 잘 반응한다는 정도만 체감했을 뿐입니다.

DALL-E의 수명이 얼마 남지 않았다는 가장 확실한 신호였습니다. OpenAI는 이미 자사의 대표 소비자 제품에서 해당 모델을 제외한 것입니다.

2026년 초: 지원 중단 공식 발표

OpenAI는 DALL-E 2와 DALL-E 3 API가 퇴역되며, 종료일은 2026년 5월 12일이라고 공식 발표했습니다. API 사용자들에게 약 4개월의 마이그레이션 기간이 주어졌습니다.

2026년 3월: Sora 종료

DALL-E 종료일이 오기도 전에, OpenAI는 텍스트-투-비디오 생성 모델인 Sora를 퇴역시켰습니다. 공식적으로는 리소스 재집중을 이유로 들었지만, 패턴은 명확했습니다. OpenAI가 독립형 크리에이티브 AI 도구에서 물러나, 핵심 LLM 제품에 통합된 기능 쪽으로 방향을 전환하고 있었습니다.

2026년 5월 12일: DALL-E 종료

엔드포인트가 응답을 멈춥니다. 오리지널 DALL-E 블로그 포스트 이후 5년 4개월 만에, 이 제품 라인은 완전히 퇴역합니다.

5월 12일에 정확히 무엇이 퇴역되는가

무엇이 작동을 멈추고 무엇이 영향을 받지 않는지 구체적으로 살펴보겠습니다.

종료되는 것

  • DALL-E 2 APIdall-e-2 모델 엔드포인트가 요청 수신을 중단합니다. POST /v1/images/generations"model": "dall-e-2"를 지정하는 모든 애플리케이션은 오류 응답을 받게 됩니다.
  • DALL-E 3 APIdall-e-3 모델 엔드포인트가 요청 수신을 중단합니다. 마찬가지로 DALL-E 3를 모델로 지정하는 모든 API 호출이 실패합니다.
  • DALL-E 이미지 편집 엔드포인트 — DALL-E 2에 의존하던 /v1/images/edits 엔드포인트(인페인팅)가 더 이상 작동하지 않습니다.
  • DALL-E 변형 엔드포인트/v1/images/variations 엔드포인트도 함께 퇴역됩니다.
  • Azure OpenAI DALL-E 배포 — Azure OpenAI Service를 통해 DALL-E 2 또는 DALL-E 3를 배포한 Azure 고객도 영향을 받습니다. Microsoft는 5월 12일에 맞춰 자체 마이그레이션 가이드를 발표했습니다.

영향을 받지 않는 것

  • ChatGPT 이미지 생성 — ChatGPT는 이미 2025년 12월에 GPT Image 1.5로 전환되었습니다. ChatGPT(웹, 모바일, 데스크톱 앱)를 통해 이미지를 생성하는 경우, 5월 12일에 달라지는 것은 없습니다.
  • 기존 생성 이미지 — DALL-E로 이미 생성한 이미지는 사용자의 것이며 사라지지 않습니다. 다만 DALL-E 엔드포인트를 통해 새 이미지를 생성하는 기능만 종료됩니다.
  • GPT Image API 엔드포인트 — GPT Image 1.5(및 곧 출시될 GPT-Image-2)를 사용하는 최신 이미지 생성 엔드포인트는 정상적으로 계속 작동합니다.

기존 연동에 미치는 영향

실질적인 혼란이 발생하는 지점입니다. DALL-E 2 또는 DALL-E 3에 직접 API 호출을 하는 모든 애플리케이션, 서비스, 워크플로는 마이그레이션하지 않으면 5월 12일에 중단됩니다. 해당되는 경우는 다음과 같습니다:

  • DALL-E 기반의 AI 이미지 생성 기능을 제공하는 SaaS 제품
  • DALL-E가 통합된 마케팅 자동화 도구
  • DALL-E API를 호출하는 디자인 도구 및 Figma/Canva 플러그인
  • DALL-E 엔드포인트를 기반으로 구축된 사내 도구
  • DALL-E 모델명을 참조하는 노코드/로우코드 워크플로(Zapier, Make 등)
  • OpenAI SDK에서 DALL-E 모델을 지정하는 모바일 앱

이 중 하나라도 관리하고 있다면, 5월 12일은 절대적인 마감 기한입니다.

DALL-E 대체 모델: 멀티모달 LLM 통합 생성으로의 전환

DALL-E의 퇴역은 단순한 제품 교체가 아닙니다. OpenAI가 이미지 생성에 접근하는 방식의 근본적인 아키텍처 전환을 의미합니다. 기존 모델: 텍스트 프롬프트를 받아 이미지를 반환하는 전문화된 이미지 생성 시스템. 새로운 모델: 대화 맥락을 완전히 이해하면서 네이티브 출력 양식 중 하나로 이미지를 생성할 수 있는 멀티모달 LLM.

GPT Image 1.5: 현재 기본 모델

GPT Image 1.5는 2025년 12월부터 ChatGPT의 기본 이미지 생성 모델로 사용되고 있으며, API를 통해서도 이용 가능합니다. 주요 특징은 다음과 같습니다:

  • 대화 맥락 인식 생성. 각 프롬프트를 독립적인 요청으로 처리하던 DALL-E와 달리, GPT Image 1.5는 전체 대화 맥락을 이해합니다. 10개 메시지에 걸쳐 브랜드 가이드라인을 논의했다면, 생성되는 이미지에 마지막 프롬프트뿐 아니라 전체 대화가 반영됩니다.
  • 반복적 수정. "배경을 더 어둡게 해줘"나 "텍스트를 왼쪽으로 옮겨줘"라고 말하면 GPT Image 1.5는 무엇을 가리키는지 이해합니다. DALL-E에서는 수정할 때마다 이미지 전체를 처음부터 다시 설명해야 했습니다.
  • 빠른 생성 속도. GPT Image 1.5는 DALL-E 3보다 눈에 띄게 빠르게 결과물을 생성하며, 특히 단순한 요청에서 그 차이가 두드러집니다.
  • 텍스트 추론과 통합. 이미지 생성이 LLM 내부에서 이루어지기 때문에, 모델이 무엇을 생성할지 먼저 추론한 뒤 생성합니다. 이로 인해 복잡하고 여러 요소가 포함된 프롬프트에 대한 준수도가 높아집니다.

API 사용자에게 DALL-E 3에서 GPT Image 1.5로의 마이그레이션 경로는 비교적 간단합니다. 엔드포인트 구조가 비슷하지만, 파라미터와 가격 책정에서 차이가 있으므로 이를 고려해야 합니다.

GPT-Image-2: 곧 출시될 후속 모델

GPT-Image-2는 아직 공식 발표되지 않았지만, 사실상 공공연한 비밀입니다. 2026년 4월 4일, GPT-Image-2의 예상 사양과 일치하는 모델이 크라우드소싱 AI 벤치마크 플랫폼인 LM Arena(구 LMSYS Chatbot Arena)에 등장했습니다. 결과는 놀라웠습니다.

LM Arena 데이터와 얼리 액세스 테스트를 기반으로 한 상세 리뷰를 발표했습니다: GPT-Image-2 프리뷰 리뷰. 주요 내용을 요약하면:

  • 텍스트 렌더링 정확도 99%. AI 이미지 생성의 시작부터 아킬레스건이었던 문제입니다. DALL-E 3는 간혹 짧은 텍스트를 정확히 렌더링할 수 있었지만, GPT-Image-2는 문단, 로고, 복잡한 타이포그래피를 거의 완벽한 정확도로 처리합니다.
  • 색조 왜곡 해결. GPT Image 1.5의 알려진 문제 — 생성된 이미지에 원치 않는 색 왜곡이 추가되는 현상 — 이 GPT-Image-2에서 해결된 것으로 보입니다.
  • 4K 해상도 출력. 기존 모델은 1024x1024 또는 유사한 해상도에서 최대치를 기록했지만, GPT-Image-2는 최대 4K까지 네이티브로 생성합니다. 인쇄, 대형 디스플레이, 전문 디자인 작업에서 중요한 차이입니다.
  • 새로운 아키텍처. OpenAI가 기술적 세부 사항을 공개하지는 않았지만, 품질 향상 폭을 보면 GPT Image 1.5의 점진적 개선이 아닌 대규모 아키텍처 변경이 있었음을 시사합니다.

예상 출시 시기는 2026년 4월 말에서 5월 중순 — DALL-E 종료에 맞춰 편리하게 설정되어, API 사용자들에게 단순한 마감 기한이 아닌 매력적인 업그레이드 경로를 제공합니다.

아키텍처 전환: 왜 이것이 중요한가

DALL-E에서 GPT Image로의 전환은 단순한 제품 업데이트 이상의 의미를 갖습니다. 이미지 생성 작동 방식에 대한 철학적 전환입니다:

DALL-E 아키텍처 GPT Image 아키텍처
독립형 디퓨전 모델 멀티모달 LLM의 네이티브 기능
독립된 프롬프트-이미지 파이프라인 대화 내 맥락 인식
텍스트 프롬프트만 입력 가능 텍스트, 이미지, 대화 기록, 추론 모두가 생성에 반영
각 생성이 독립적 세션 내 반복적 수정 가능
별도의 안전/모더레이션 레이어 모델 추론에 안전 기능 통합
고정된 출력 크기(1024x1024 등) 4K까지 유연한 출력 크기

이는 AI 전반에서 보이는 동일한 패턴입니다: 전문화된 단일 목적 모델이 범용 멀티모달 시스템에 흡수되는 것. 이미지 생성은 코드 생성, 데이터 분석, 웹 브라우징이 ChatGPT 내에서 이미 걸어간 동일한 경로를 따르고 있습니다.

GPT Image 1.5 vs. DALL-E 3: 실제로 무엇이 달라졌나

2025년 12월에 DALL-E 3에서 GPT Image 1.5로 전환된 수백만 사용자에게, 변화는 완벽하게 매끄럽지만은 않았습니다. 나아진 부분도 있고, 아쉬운 부분도 있습니다. 솔직한 평가를 드립니다.

GPT Image 1.5에서 개선된 점

  • 대화 맥락 이해. 가장 큰 개선점입니다. ChatGPT의 DALL-E 3는 프롬프트를 DALL-E 모델에 보내기 전에 ChatGPT가 다시 작성했지만, 이미지 모델 자체는 대화를 인식하지 못했습니다. GPT Image 1.5는 대화 흐름을 네이티브로 이해합니다. 반복 작업에서 차이가 가장 두드러집니다: "좀 더 미니멀하게 만들어줘"가 기대한 대로 작동합니다.
  • 속도. GPT Image 1.5는 DALL-E 3보다 눈에 띄게 빠르게 이미지를 생성하며, 특히 표준 복잡도의 요청에서 그렇습니다.
  • 이미지 내 텍스트. 아직 완벽하지는 않지만(GPT-Image-2가 진정한 도약), GPT Image 1.5는 대부분의 경우에서 DALL-E 3보다 텍스트 렌더링을 더 잘 처리합니다. 짧은 문구, 라벨, 표지판이 더 일관되게 정확합니다.
  • 복잡한 장면에 대한 프롬프트 준수도. DALL-E 3가 부분적으로 무시하던 다중 피사체, 다중 액션 프롬프트를 GPT Image 1.5가 더 안정적으로 처리합니다.
  • 세션 내 일관된 스타일. 모델이 맥락을 유지하기 때문에, 한 대화 내에서 같은 스타일로 여러 이미지를 생성하는 것이 훨씬 쉬워졌습니다. 매번 상세한 스타일 설명을 반복할 필요가 없습니다.

사용자들이 DALL-E 3에서 아쉬워하는 점

  • 특정 아트 스타일. DALL-E 3는 일부 사용자가 선호하는 특유의 미감이 있었으며, 특히 일러스트레이션 스타일 출력에서 두각을 나타냈습니다. GPT Image 1.5가 항상 정확히 재현하지는 못하는 "깔끔한 디지털 일러스트레이션" 느낌에 특히 뛰어났습니다.
  • 예측 가능성. DALL-E 3는 좁은 의미에서 더 예측 가능했습니다 — 같은 프롬프트, 비슷한 결과. GPT Image 1.5의 맥락 인식 특성은 대화 기록에 따라 다른 결과를 만들 수 있는데, 대부분은 장점이지만 가끔은 불편함이 됩니다.
  • 편집 엔드포인트. DALL-E 2의 인페인팅과 아웃페인팅은 GPT Image API에 아직 직접적인 대응 기능이 없는 고유한 기능이었습니다. 이 기능을 중심으로 워크플로를 구축한 사용자는 대안적 접근이 필요합니다.
  • 가격 투명성. DALL-E 3는 이미지당 간단명료한 가격 체계를 가지고 있었습니다. API를 통한 GPT Image 1.5 가격은 토큰 기반이라 예산 수립 시 예측이 어려울 수 있습니다.

종합 평가

대부분의 사용자와 사용 사례에서 GPT Image 1.5는 DALL-E 3에 비해 확실한 업그레이드입니다. 대화 맥락과 반복적 수정 기능만으로도 크리에이티브 워크플로의 일부로 이미지를 생성하는 모든 사용자에게 더 나은 도구입니다. 전환의 영향을 가장 크게 받는 사용자는 DALL-E 3의 정확한 동작과 API 구조를 기반으로 특정 자동화 파이프라인을 구축한 경우입니다.

GPT-Image-2: 진정한 후속 모델

GPT Image 1.5가 다리 역할이라면, GPT-Image-2는 목적지입니다. 4월 4일 LM Arena 결과와 얼리 액세스 보고를 기반으로 보면, GPT-Image-2는 DALL-E 퇴역이 손실이 아니라 길을 여는 필수적 정리처럼 느껴지게 만드는 세대적 도약을 보여줍니다.

현재까지 알려진 사실

GPT-Image-2에 대해서는 상세 리뷰에서 다루었지만, DALL-E 퇴역 맥락에서 핵심적인 사실을 정리하면:

  • 텍스트 렌더링 문제가 사실상 해결되었습니다. 이미지 내 텍스트 정확도 99%. DALL-E 탄생 이래 모든 이미지 생성 모델에서 가장 흔한 불만이었습니다. GPT-Image-2는 여러 줄의 텍스트, 다양한 폰트, 로고, 타이포그래피 레이아웃을 거의 완벽한 정확도로 처리합니다.
  • 4K 네이티브 해상도. 업스케일링 트릭 없이 최대 4096x4096까지 네이티브로 생성합니다. 전문 디자인, 인쇄물 제작, 고해상도 마케팅 자료에서 주요 제약이 사라집니다.
  • 색조 왜곡 문제 해결. GPT Image 1.5에서 원치 않는 따뜻하거나 차가운 색조가 추가되는 알려진 문제가 있었습니다. GPT-Image-2는 기본적으로 중립적이고 정확한 색상을 생성하면서도 프롬프트의 색상 지시에는 민감하게 반응합니다.
  • 포토리얼리즘의 새로운 기준. 나란히 비교해 보면 GPT-Image-2의 포토리얼리스틱 출력은 이전 어떤 모델보다도 실제 사진과 구분하기 어려운 수준입니다.
  • 스타일 범위. 초기 테스트에 따르면 GPT-Image-2는 GPT Image 1.5보다 더 넓은 범위의 예술 스타일을 처리하며, DALL-E 3의 일러스트레이션 기능을 선호하던 사용자의 불만을 해소할 가능성이 있습니다.

예상 출시 시기

OpenAI는 공식 출시일을 발표하지 않았지만, 여러 신호가 2026년 4월 말에서 5월 초중순을 가리킵니다. 전략적으로 타당한 시점입니다: 5월 12일 전에 GPT-Image-2 출시를 발표하여, DALL-E API 사용자들에게 단순히 기존 모델에서 쫓겨나는 마감 기한이 아닌 매력적인 마이그레이션 동기를 제공합니다.

마이그레이션을 계획 중인 API 사용자를 위한 실질적 조언: 5월 12일 서비스 연속성을 위해 지금 GPT Image 1.5로 마이그레이션하고, GPT-Image-2가 출시되면 업그레이드하세요.

DALL-E 없는 경쟁 환경

DALL-E의 퇴역은 진공 속에서 일어나지 않습니다. 2026년 AI 이미지 생성 시장은 2022년 DALL-E 2가 처음 출시되었을 때보다 훨씬 치열해졌습니다. DALL-E 퇴역으로 누가 이득을 보는지, 시장 현황은 어떤지 살펴보겠습니다.

Midjourney

Midjourney는 2022년부터 소비자 시장에서 DALL-E의 주요 경쟁자였습니다. DALL-E가 사라지면서 Midjourney는 가장 유명한 독립형 AI 이미지 생성 브랜드가 됩니다. 2026년 초 출시된 V7 모델은 예술적이고 창의적인 사용 사례에서 탁월한 결과를 만들어냅니다. Midjourney의 강점은 항상 미학적 품질과 커뮤니티였으며, 어차피 DALL-E로 전환하지 않을 충성도 높은 사용자 기반을 구축해 왔습니다.

DALL-E의 퇴역으로 통합형 ChatGPT 경험보다 전용 이미지 생성 도구를 원하는 일부 사용자가 Midjourney로 이동할 수 있습니다. 하지만 Midjourney의 Discord 우선 인터페이스와 완전한 기능의 API 부재(웹 앱은 아직 비교적 새로움)는 개발자와 기업 사용자에 대한 매력을 제한합니다.

Flux (Black Forest Labs)

Flux는 이미지 생성 분야의 오픈소스 리더로 부상했습니다. Flux Pro와 Flux Dev는 DALL-E 3에 필적하는 품질을 제공하며, 오픈소스 Flux Schnell 모델은 로컬에서 빠르고 무료로 이미지를 생성하려는 개발자들의 필수 도구가 되었습니다. DALL-E의 퇴역은 이미지 생성 스택에 대한 더 많은 제어권을 원하고 OpenAI의 제품 결정에 의존하고 싶지 않은 개발자들을 위한 주요 대안으로서 Flux의 입지를 강화합니다.

Ideogram

Ideogram은 DALL-E가 지속적으로 어려움을 겪던 분야인 이미지 내 텍스트 렌더링에서 뛰어난 성능으로 일찍이 틈새시장을 개척했습니다. GPT-Image-2가 텍스트 문제를 해결했다는 보고에 따라 Ideogram은 위로부터 새로운 경쟁 압력에 직면하지만, 중간 시장 선택지였던 DALL-E의 퇴역으로 디자인과 타이포그래피 중심 생성에서 Ideogram의 전문적 강점으로 더 많은 사용자가 유입될 수 있습니다.

Nano Banana Pro 및 Nano Banana 2

Nano Banana는 포토리얼리즘에 뛰어난 빠르고 고품질 옵션으로 주목받고 있습니다. GPT-Image-2 비교 리뷰에서 다루었듯이, Nano Banana 2는 여러 벤치마크에서 GPT-Image-2와 직접 경쟁합니다. DALL-E의 퇴역으로 생긴 시장 공간을 Nano Banana가 채울 좋은 위치에 있으며, 특히 OpenAI 생태계의 대안을 원하는 API 사용자에게 적합합니다.

Stable Diffusion (Stability AI)

Stability AI는 격동의 몇 년을 보냈지만, Stable Diffusion은 특히 오픈소스와 셀프 호스팅 분야에서 가장 널리 사용되는 이미지 생성 모델 중 하나로 남아 있습니다. SD3와 SDXL 생태계는 파인 튜닝된 모델과 도구의 거대한 커뮤니티를 보유하고 있습니다. 최대한의 커스터마이징, 로컬 추론, 또는 전문적인 파인 튜닝이 필요한 사용자에게 Stable Diffusion은 여전히 주요 선택지입니다. DALL-E의 퇴역이 이 시장 세그먼트에 직접적인 영향을 미치지는 않지만, 완전 통합형 솔루션(GPT Image 같은)이나 완전 개방형 솔루션(SD 같은) 중 하나로 향하는 트렌드를 강화합니다.

Google의 Imagen과 Gemini

Gemini와 Vertex AI API를 통해 제공되는 Google의 Imagen 3도 멀티모달 LLM 통합 이미지 생성 시스템입니다. Google은 OpenAI와 유사한 아키텍처 경로를 따르고 있습니다: 독립 서비스가 아닌 대화형 AI의 네이티브 기능으로서의 이미지 생성. DALL-E의 퇴역은 이 접근 방식을 검증하며, Gemini의 이미지 기능에 대한 Google의 투자를 가속화할 수 있습니다.

전체 그림

DALL-E의 퇴역은 시장을 세 가지 계층으로 명확히 구분합니다:

  1. 통합형 멀티모달 플랫폼(OpenAI GPT Image, Google Gemini/Imagen) — 범용 AI의 기능으로서의 이미지 생성
  2. 전용 이미지 생성 서비스(Midjourney, Ideogram, Nano Banana) — 이미지 품질과 창작 제어를 우선시하는 사용자를 위한 전문 도구
  3. 오픈소스 및 셀프 호스팅(Flux, Stable Diffusion) — 특정 요구 사항을 가진 개발자와 기업을 위한 최대 제어권과 커스터마이징

DALL-E는 어색한 중간 지대에 있었습니다: 통합형 멀티모달 AI에 점점 더 집중하는 회사의 독립형 이미지 모델. 퇴역은 그 긴장을 해소합니다.

시장 점유율 영향

DALL-E의 퇴역은 상당한 사용자 기반을 재분배합니다. 정확한 수치는 공개되지 않았지만, DALL-E 3는 가장 널리 사용되는 이미지 생성 API 중 하나였으며, 특히 모든 AI 니즈에 OpenAI 생태계를 기본으로 사용하는 기업 고객 사이에서 그랬습니다. 이 사용자들은 이제 선택에 직면합니다: OpenAI 생태계에 남을 것인가(GPT Image 1.5 / GPT-Image-2), 전문 도구로 다변화할 것인가, 아니면 여러 제공업체를 추상화하는 멀티모델 플랫폼을 도입할 것인가.

OpenAI의 이미지 생성 생태계를 완전히 떠날 가능성이 가장 높은 개발자는 이미 DALL-E 3의 한계 — 특히 텍스트 렌더링, 예술적 제어, 파인 튜닝 옵션 부재 — 에 불만을 가지고 있던 이들입니다. 이들에게 Flux의 오픈소스 커스터마이징 가능성이나 Midjourney의 우수한 미학적 결과물은 이미 매력적이었습니다. 강제 마이그레이션은 관성이라는 요인을 제거합니다.

API 사용자가 5월 12일 전에 해야 할 일: 마이그레이션 체크리스트

DALL-E 2 또는 DALL-E 3 API를 호출하는 프로덕션 시스템이 있다면, 시간이 촉박합니다. 실질적인 마이그레이션 계획을 제시합니다.

1단계: DALL-E 사용 현황 감사

  • 코드베이스에서 dall-e-2dall-e-3 모델명 참조를 검색합니다
  • /v1/images/generations, /v1/images/edits, /v1/images/variations 호출을 확인합니다
  • OpenAI 대시보드 사용 로그를 검토하여 DALL-E 엔드포인트를 사용하는 모든 애플리케이션을 확인합니다
  • 노코드/로우코드 도구(Zapier, Make, Retool 등)에서 DALL-E 연동을 확인합니다
  • 해당되는 경우 Azure OpenAI 배포를 감사합니다

2단계: API 차이점 이해

  • 모델명 변경: "model": "dall-e-3"를 적절한 GPT Image 모델 식별자로 업데이트합니다
  • 파라미터 차이: DALL-E 전용 파라미터(quality, style 등)가 GPT Image API에서 다르게 작동하거나 유효 값이 다를 수 있습니다
  • 응답 형식: 응답 구조가 기존 파싱 로직과 일치하는지 확인합니다
  • 가격 모델: GPT Image는 이미지당 과금이 아닌 토큰 기반 과금을 사용합니다. 비용 추적과 예산을 그에 맞게 업데이트하세요
  • 사용량 제한: 새 엔드포인트의 사용량 제한이 기존 사용 패턴에 부합하는지 확인합니다

3단계: 업데이트 및 테스트

  • OpenAI SDK를 최신 버전으로 업데이트합니다(이전 버전은 GPT Image 엔드포인트를 지원하지 않을 수 있음)
  • API 호출을 새 모델과 엔드포인트로 수정합니다
  • 기존 프롬프트 세트를 GPT Image 1.5에서 실행하고 출력을 비교합니다
  • 엣지 케이스를 테스트합니다: 매우 긴 프롬프트, 특정 스타일 요구 사항이 있는 프롬프트, DALL-E 특유의 미감에서 잘 작동하던 프롬프트
  • DALL-E 2의 편집 또는 변형 엔드포인트를 사용했다면, 대안 워크플로를 구현합니다(GPT Image는 전용 엔드포인트가 아닌 대화 맥락을 통해 반복 편집을 처리)

4단계: 인페인팅/아웃페인팅 공백 대응

제품이 DALL-E 2의 /v1/images/edits 엔드포인트에 의존해 인페인팅이나 아웃페인팅을 수행했다면, 대안적 접근이 필요합니다. 옵션은 다음과 같습니다:

  • GPT Image의 대화형 편집 기능 사용(원하는 편집을 자연어로 설명)
  • 대안적 인페인팅 솔루션 통합(Flux Fill, Stable Diffusion 인페인팅)
  • 더 강력한 편집 기능이 포함될 것으로 예상되는 GPT-Image-2 출시 대기

5단계: 문서 및 커뮤니케이션 업데이트

  • 제품 문서를 모델 변경에 맞게 업데이트합니다
  • 제품에 "Powered by DALL-E" 또는 유사한 브랜딩이 있다면 업데이트합니다
  • 변경이 사용자 경험에 영향을 미치는 경우(다른 출력 스타일, 가격 변경 등) 사용자에게 알립니다
  • 이용약관이나 개인정보 보호 정책에 특정 OpenAI 모델을 참조하는 내용이 있으면 업데이트합니다

6단계: GPT-Image-2 대비 계획

  • 5월 12일 서비스 연속성을 위해 지금 GPT Image 1.5로 마이그레이션합니다
  • 모델 교체가 쉽도록 연동을 설계합니다(하드코딩이 아닌 설정 기반 모델 선택)
  • GPT-Image-2가 출시되면 프로덕션 트래픽 전환 전에 사용 사례별 테스트를 수행합니다
  • 제품의 품질 요구 사항에 따라 사용자에게 모델 선택권을 제공하는 것도 고려합니다

OpenAI의 크리에이티브 제품 전략: 패턴이 보인다

DALL-E 퇴역에서 한 발짝 물러서 보면, 지난 1년간 OpenAI의 제품 결정에서 명확한 패턴이 나타납니다.

독립형 크리에이티브 도구에서의 후퇴

2026년 3월: Sora 종료. 2024년 초 엄청난 기대 속에 출시된 OpenAI의 텍스트-투-비디오 모델이 경쟁, 비용 구조, 안전성 문제에 시달린 끝에 퇴역되었습니다. 비디오 생성 기능은 별도 제품이 아닌 ChatGPT/API 생태계로 통합되고 있습니다.

2026년 5월: DALL-E 종료. GPT 모델 내 통합형 멀티모달 생성을 위해 이미지 생성의 선구자가 퇴역합니다.

OpenAI에서 가장 대중적으로 인지도 높은 크리에이티브 AI 제품 두 가지가 두 달 만에 사라집니다. 우연이 아닙니다 — 전략입니다.

통합 가설

OpenAI의 판단은 크리에이티브 기능이 독립 제품보다 범용 AI 시스템의 기능으로서 더 큰 가치를 지닌다는 것입니다. 그 논리는:

  • 맥락이 중요합니다. 대화, 프로젝트, 선호도를 이해하는 이미지 생성 모델이 각 프롬프트를 독립적으로 보는 모델보다 더 나은 결과를 만들어냅니다.
  • 유지 비용. 텍스트, 이미지, 비디오, 코드 등 각 양식에 별도 모델을 운영하는 것은 비용이 많이 들고 복잡합니다. 단일 멀티모달 아키텍처로 통합하는 것이 더 효율적입니다.
  • 사용자 경험. 사용자는 도구 간 전환을 원하지 않습니다. 모든 것을 처리하는 하나의 인터페이스를 원합니다. ChatGPT 내 "이미지 만들어줘"의 인기가 별도의 DALL-E 도구를 여는 것과 비교하여 이를 증명합니다.
  • 경쟁 포지셔닝. 독립형 이미지 생성 시장은 포화 상태입니다(Midjourney, Flux, Ideogram, Stable Diffusion). 통합형 멀티모달 AI 시장은 경쟁이 덜하고 복제하기도 어렵습니다.

업계에 미치는 영향

OpenAI의 행보는 AI 업계 전체에 영향을 미칠 광범위한 트렌드를 시사합니다:

  • 독립형 크리에이티브 AI 도구에 통합 압력이 가해집니다. 세계 최대 AI 기업이 독립형 이미지 및 비디오 생성 모델을 별도로 유지할 가치가 없다고 판단했다면, 유사한 독립 제품을 만드는 소규모 회사들도 주목해야 합니다.
  • 멀티모달이 새로운 기본이 됩니다. Google(Gemini), Anthropic(Claude) 및 기타 주요 AI 연구소가 자체 멀티모달 기능을 가속화할 것으로 예상됩니다. 기대치가 "당신의 AI가 이미지를 생성할 수 있나요?"에서 "하나의 대화 안에서 이미지, 비디오, 오디오, 코드를 생성할 수 있나요?"로 전환되고 있습니다.
  • API 안정성이 현실적인 문제가 됩니다. DALL-E 기반으로 개발한 개발자들이 이제 강제 마이그레이션에 직면합니다. 이 경험은 팀들이 특정 모델에 대한 깊은 통합에 더 신중해지고, 업스트림 모델 변경으로부터 보호하는 추상화 레이어에 더 관심을 갖게 만들 것입니다.
  • 오픈소스의 이점이 커집니다. Flux와 Stable Diffusion이 OpenAI가 제공할 수 없는 한 가지를 제공합니다: 기업의 제품 결정으로 퇴역되지 않는다는 점. 장기적인 안정성이 필요한 조직에게, DALL-E와 Sora의 종료를 본 후 셀프 호스팅 오픈소스 모델이 더 매력적으로 다가옵니다.
  • 추상화 레이어가 필수 인프라가 됩니다. DALL-E 퇴역은 특정 모델에 직접 결합하는 것이 왜 위험한지를 보여주는 사례 연구입니다. 애플리케이션을 특정 모델 제공업체로부터 분리하는 미들웨어와 오케스트레이션 플랫폼에 대한 수요가 증가할 것으로 예상됩니다.

Genra의 시각

이 글은 DALL-E와 OpenAI의 전략에 관한 것이지 Genra에 관한 것이 아니므로 간략하게 다루겠습니다. 하지만 DALL-E 퇴역은 저희 플랫폼의 설계 철학을 잘 보여줍니다.

Genra는 여러 이미지 및 비디오 생성 모델을 백엔드에서 통합합니다. Genra를 통해 콘텐츠를 생성하면, 멀티모델 오케스트레이션 레이어가 이미지 유형, 스타일 요구 사항, 해상도 필요, 속도 등의 요소를 고려하여 최적의 모델을 선택합니다. 5월 12일 DALL-E가 퇴역해도 Genra 사용자는 아무것도 체감하지 못합니다. 오케스트레이션 레이어가 DALL-E 엔드포인트로의 라우팅을 중단하고 GPT Image 1.5, GPT-Image-2(출시 시), 기타 스택의 모델로 계속 라우팅할 뿐입니다.

이것이 개별 모델 API에 직접 통합하는 것이 아닌 플랫폼 레벨에서 작업하는 이점입니다. 모델은 왔다 갔다 합니다. 제품은 퇴역됩니다. 여러 모델을 추상화하는 플랫폼은 단일 모델 통합이 제공할 수 없는 연속성을 보장합니다.

핵심 요약

  • DALL-E 2와 DALL-E 3 API는 2026년 5월 12일에 종료됩니다. 두 엔드포인트 모두 요청 수신을 중단합니다. 프로덕션 연동이 있다면 마이그레이션은 선택이 아닌 필수입니다.
  • ChatGPT 사용자는 이미 GPT Image 1.5를 사용 중입니다. 소비자 대상 전환은 2025년 12월에 이루어졌습니다. 5월 12일은 주로 API 사용자와 Azure OpenAI 배포에 영향을 미칩니다.
  • GPT Image 1.5가 즉각적인 대체 모델입니다. 이미 서비스 중이며 API를 통해 이용 가능하고, 대화 맥락과 반복적 수정 측면에서 진정한 업그레이드입니다.
  • GPT-Image-2 출시가 임박했습니다. 2026년 4월 말에서 5월 중순 예상되며, 99% 텍스트 렌더링, 4K 해상도, 색조 왜곡 문제 해결을 갖춘 DALL-E의 진정한 후속 모델입니다.
  • 아키텍처 전환은 독립형에서 통합형으로 향합니다. OpenAI는 이미지 생성을 별도 모델에서 LLM의 네이티브 기능으로 전환하고 있습니다. Google도 Gemini/Imagen에서 같은 경로를 걷고 있습니다.
  • Sora + DALL-E 퇴역은 명확한 전략을 보여줍니다. OpenAI는 독립형 크리에이티브 도구에서 물러나 ChatGPT와 API에 통합된 기능으로 방향을 전환하고 있습니다. 이 트렌드는 계속될 것으로 예상됩니다.
  • 경쟁 환경에서 다른 플레이어들이 이득을 봅니다. Midjourney, Flux, Ideogram, Nano Banana, Stable Diffusion 모두 DALL-E가 독립형 이미지 생성 시장에서 퇴장하면서 시장 점유율을 확보합니다.
  • API 안정성에 대한 우려가 커지고 있습니다. 두 달 만에 두 번의 주요 모델 퇴역은 개발자들을 업스트림 변경으로부터 보호하는 추상화 레이어와 멀티모델 플랫폼으로 향하게 할 것입니다.

자주 묻는 질문

DALL-E는 정확히 언제 종료되나요?

DALL-E 2와 DALL-E 3 API 모두 2026년 5월 12일에 요청 수신을 중단합니다. 해당 날짜 이후 DALL-E 모델을 지정하는 모든 API 호출은 오류를 반환합니다. ChatGPT 이미지 생성은 이미 2025년 12월에 GPT Image 1.5로 전환되었으므로 영향을 받지 않습니다.

기존에 DALL-E로 생성한 이미지가 삭제되나요?

아닙니다. DALL-E로 이미 생성한 이미지는 사용자의 것이며 삭제되지 않습니다. 퇴역은 DALL-E 엔드포인트를 통해 새 이미지를 생성하는 기능에만 적용됩니다. OpenAI 계정 기록에 저장되었거나 로컬에 다운로드한 이미지는 계속 접근 가능합니다.

DALL-E 3 API의 직접적인 대체 모델은 무엇인가요?

GPT Image 1.5가 현재 대체 모델이며 OpenAI API를 통해 이용 가능합니다. GPT-Image-2는 추가 업그레이드로 2026년 4월 말에서 5월 중순 출시가 예상됩니다. API 구조가 DALL-E 3와 유사하지만 동일하지는 않으므로, 모델명 업데이트, 파라미터 변경 검토, 토큰 기반 가격에 대한 조정이 필요합니다.

GPT Image 1.5가 DALL-E 3보다 나은가요?

대부분의 사용 사례에서 그렇습니다. GPT Image 1.5는 더 나은 대화 맥락 인식, 빠른 생성 속도, 개선된 텍스트 렌더링, 복잡한 프롬프트에 대한 강화된 준수도를 제공합니다. 일부 사용자는 DALL-E 3 특유의 일러스트레이션 미감과 출력의 예측 가능성을 아쉬워합니다. DALL-E 2의 편집 엔드포인트(인페인팅, 아웃페인팅, 변형)는 아직 직접적인 대응 기능이 없습니다.

Sora에는 무슨 일이 있었고, DALL-E 종료와 관련이 있나요?

OpenAI는 2026년 3월 텍스트-투-비디오 모델인 Sora를 종료했습니다. OpenAI가 두 결정을 명시적으로 연결하지는 않았지만, 같은 패턴을 따릅니다: 독립형 크리에이티브 AI 제품을 퇴역시키고 해당 기능을 ChatGPT와 API 내 통합형 멀티모달 시스템으로 흡수하는 것. 두 결정 모두 각 크리에이티브 양식에 별도 모델을 유지하는 것에서 벗어나려는 OpenAI의 전략적 전환을 반영합니다.

Azure OpenAI DALL-E 배포도 영향을 받나요?

예. Azure OpenAI Service를 통해 DALL-E 2 또는 DALL-E 3를 배포한 Azure 고객도 2026년 5월 12일 종료 일정의 영향을 받습니다. Microsoft는 Azure 고객을 위한 마이그레이션 가이드를 발표했습니다. Azure별 마이그레이션 경로와 대체 모델 배포에 대해서는 Azure OpenAI Service 문서를 확인하세요.

인페인팅이나 아웃페인팅이 필요한데, DALL-E 2 엔드포인트가 퇴역되면 무엇을 사용해야 하나요?

여러 옵션이 있습니다: GPT Image 1.5의 대화형 편집 사용(원하는 편집을 자연어로 설명), 프로그래밍 방식 사용을 위한 Flux Fill이나 Stable Diffusion 인페인팅 같은 대안 통합, 또는 향상된 편집 기능이 포함될 것으로 예상되는 GPT-Image-2 출시 대기. 어떤 접근이 적합한지는 API 수준의 프로그래밍 방식 접근이 필요한지, 대화형 인터페이스에서 작업할 수 있는지에 따라 달라집니다.

이것이 여러 AI 모델을 사용하는 Genra 같은 플랫폼에 어떤 영향을 미치나요?

멀티모델 플랫폼은 개별 모델 퇴역의 영향을 가장 적게 받습니다. 여러 이미지 생성 모델을 백엔드에서 통합하는 Genra 같은 플랫폼은 모델이 퇴역되면 자동으로 요청을 재라우팅하여 사용자가 중단을 경험하지 않도록 합니다. 이것이 단일 모델의 API에 직접 통합하는 것이 아닌 플랫폼 레이어를 사용하는 실질적인 이점입니다.


저자 소개
Genra AI 팀은 AI 이미지 및 비디오 생성 분야의 동향을 다룹니다. 빠르게 변화하는 AI 크리에이티브 도구 환경에 대한 최신 분석과 업데이트를 보려면 @GenraAI를 팔로우하세요.