이미 일어난 여섯 가지 변화: 2026년 중반 AI 영상 결산

예측이 아니다. 인벤토리다. 이미 업계가 굴러가는 방식이 된 여섯 가지 사실.

당신이 모델을 보고 있는 동안 분야는 재편됐다

새해 전야에 잠들었다가 이번 주에 깼다면, 2025년 12월 버전의 AI 영상은 알아볼 수 없을 것이다. Sora 2 로고는 OpenAI 제품 페이지에서 사라졌다. Artificial Analysis Video Arena에서 가장 많이 인용되는 모델은 8주 전에는 존재하지도 않았던, 들어본 적 없는 팀이 익명으로 출시한 것이다. 크리에이터 포럼의 지배적 질문은 더 이상 "어떤 모델이 가장 좋은가"가 아니다. "어떤 에이전트를 돌려야 하는가"이다. 캐릭터 일관성 — 2년간 모든 장편 AI 프로젝트의 병목이었던 것 — 은 누구도 굳이 광고하지 않는 기능이 됐다. 10분짜리 AI 다큐멘터리는 연초만 해도 달 착륙급 데모였지만, 지금은 단독 크리에이터가 한 영업 주에 출하하는 것이다.

5개월. 여섯 변화. 어느 것도 예측이 아니다. 인벤토리다: 2026년 5월 시점에 이미 업계가 실제로 작동하는 방식이 된 사실들. 아래는 각각이 무엇이었는지, 무엇이 바뀌었는지, 그 뒤의 구체적 사건과 숫자, 그리고 당신이 다음에 만들 것에 대해 무엇을 의미하는지.

변화 1 — Sora 2의 붕괴가 분야의 정상을 재편했다

지금까지 올해 가장 큰 단일 사건에는 날짜가 있다: 2025년 12월 31일(Sora 2 출시), 2026년 1월 10일(10일 후 무료 등급 중단), 2026년 3월 24일(종료 발표), 2026년 4월 26일(소비자 앱과 웹 폐쇄), 2026년 9월 24일(API 종료). 소비자 제품으로 84일. AI 영상 역사상 가장 과대 광고된 출시가 단일 회계 분기 안에 출시·정점·접힘을 마쳤다.

핵심 숫자들을 한 자리에서 보는 것이 가치 있다 — 왜 붕괴가 그렇게 빨랐는지, 왜 그렇게 많은 자본과 신뢰를 함께 끌어내렸는지를 설명하기 때문이다:

지표	Sora 2	업계 벤치마크
피크 시 일일 추론 비용	약 $1,500만	비슷한 볼륨에서 한 자릿수 낮음
Sora 귀속 누적 매출	약 $210만	—
비용/매출 비율	약 600:1	지속 가능한 AI 도구 <5:1
1080p 액세스	$200/월(Pro 등급만)	$5–30/월(Kling, Runway, Seedance)
표준 등급 해상도	480p	720p–1080p
무료 등급 기간	10일 후 제거	지속(제한)

디즈니 손해가 재정 손해를 가중시켰다. OpenAI와 디즈니는 디즈니 애니메이션, 마블, 픽사, 스타워즈에 걸쳐 200개 이상의 캐릭터를 다루는 약 10억 달러 IP 계약에 서명했다 — AI 영상 제품이 정렬한 가장 큰 해자. 디즈니는 공개 발표 1시간도 채 되지 않아 통보받았다고 보도됐다. 계약은 무너졌다. 소비자 Sora 노력에 관여한 OpenAI 임원 3명이 그 후 몇 주 안에 떠났다. (전체 사후 분석은 OpenAI가 Sora를 죽인 이유 분석 참조.)

하류 효과는 대부분의 관찰자가 예측한 것과 달랐다. Sora 2 사용자는 단일 대체로 이주하지 않았다. 그들은 작업별로 예측 가능하게 갈라졌다: 물리 무거운 작업은 Veo 3.1로, 카메오 스타일 인물 삽입은 Kling 3로, 긴 스토리보드 시퀀스는 Seedance 2로, 사진사실주의 인물 작업은 Luma Ray3로(이주 보고서는 Sora 사용자가 어디로 갔는지에서 분포를 자세히 추적). "모두를 다스리는 하나의 모델" 프레임은 Sora 2와 함께 무너졌고 재건되지 않았다.

무엇이 바뀌었나. 리더보드는 이제 작업별이다. 2026년 5월에는 Q1 스타일의 "톱 모델" 답이 없다. 올바른 질문은 당신이 찍는 샷에 어떤 모델이 맞는지이고, 그 질문에는 점점 에이전트가 답한다, 크리에이터가 아니라. 단일 영웅 모델이 크리에이터의 스택을 닻으로 잡을 수 있던 시대는 끝났고, 돌아올 가능성은 낮다 — Sora 2를 죽인 경제학(매출 $1당 컴퓨트 $600)은 OpenAI 고유가 아니다; 지배적 단일 모델 공급자가 되려는 누구에게나 적용된다.

변화 2 — 새로운 리더보드 정상, 중국에서 만들어진

Sora 2 퇴장의 다른 면은 중국에서 만든 모델들이 빈자리를 채우기만 한 게 아니라 — 보드의 정상을 가져갔다는 것이다. 가장 명확한 예시는 지금까지 2026년 가장 결과적인 모델 출시인 HappyHorse 1.0이다.

2026년 4월 7일, 이름 없는 모델이 Artificial Analysis Video Arena 리더보드에 나타났다. 보도자료 없음, 팀 로고 없음, 공개 가중치 없음. 48시간 안에 Text-to-Video에서 Elo 1389로 1위 — 이전 리더 Seedance 2.0보다 115점 위 — Image-to-Video에서 Elo 1416으로 1위. 4월 9–10일, X 계정 @AthAI_Official이 그 모델은 알리바바의 ATH AI Innovation Unit이 만들었고, 이끄는 사람은 장디 — 전 Kuaishou VP이자 Kling AI를 만든 아키텍트임을 밝혔다. 한 중국 리더의 아키텍트가 조용히 이탈해 또 다른 중국 거대 기업에서 경쟁자를 다시 만들었다. (전체 기술 분석은 HappyHorse 1.0 분석 참조.)

HappyHorse는 헤드라인이지만 유일한 데이터는 아니다. 2026년 5월 중순 기준 레인별 정상:

레인	리더(2026년 5월)	출처	이유
양식화 / 애니메이션 / 애니 인접	Kling 3.0	Kuaishou(중국)	네이티브 4K/60fps, 톱 모델 중 가장 관대한 무료 등급
참조 기반 브랜드·제품 영상	Seedance 2.0	ByteDance(중국)	다중 모달 참조 시스템, CapCut을 통해 약 5억+ 사용자에게 배포
중국어 단편 드라마와 CN 커머스	HappyHorse 1.0	Alibaba(중국)	네이티브 만다린 립싱크, 톱 등급 최저 API 가격
대화 위주, 방송 등급	Veo 3.1	Google(미국)	48 kHz 네이티브 오디오, 전문 컬러 사이언스, Extend
사진사실주의 인물 / 토킹헤드	Luma Ray3	Luma(미국)	피부 질감, 눈 행동, 미세 표정
로컬 / 온프레미스 / NDA 작업	LTX-2	Lightricks(이스라엘)	단일 고급 소비자 GPU에서 안정적으로 도는 첫 톱 등급 모델

이 여섯 리더 중 셋이 중국제다. 18개월 전에는 이 구성이 존재하지 않았다. 패턴은 민족주의적이지 않다 — 이 모델들을 만들어내는 인재와 자본 흐름이 안정적이라는 것이다: 장디 스타일의 아키텍트 이동성은 Kuaishou·ByteDance·Alibaba 사이에서 이제 흔하고, ByteDance의 CapCut 배포만으로도 서구 AI 영상 스타트업이 따라잡을 수 없는 해자다.

무엇이 바뀌었나. 모델 레이어는 더 이상 서구 디폴트가 아니다. 2026년에 제작 스택을 만드는 인디 크리에이터·에이전시·스튜디오는 중국 모델을 미국 모델과 동등하게 평가해야 한다 — 다양성 체크가 아니라 능력과 가격의 필요성으로. Q1에 그것을 배운 팀은 이미 비용에서, 그리고 서구 모델이 단순히 매치하지 못하는 능력(만다린 립싱크, 애니 인접 양식화, $0.50 미만 생성)에서 의미 있는 우위를 가지고 있다.

변화 3 — 모델 레이어가 상품화됐다

변화 2의 동반자는 "최고"와 "충분히 좋다" 사이의 격차가 무너졌다는 것이다. 2026년 5월 기준 톱 6 AI 영상 모델 모두 대부분의 사용 사례에서 클립당 출력이 광범위하게 비교 가능하다. Arena 리더보드에서 1위와 6위 사이의 Elo 격차는 2년 전 프론티어 모델과 후발 사이를 나누던 띠 안에 있다. 실제 전문화는 여전히 있다 — 위 레인 표가 나열한다 — 하지만 격차는 레인으로 좁혀졌고 절대적이지 않다.

가격 데이터는 같은 이야기를 다른 각도에서 한다. 2026년 5월 주요 모델의 1080p 5초 클립 생성 비용:

모델	생성당 비용(5초, 1080p)	입문 플랜
Kling 3.0	약 $0.20–0.30	$5/월
HappyHorse 1.0	약 $0.25	API만, 톱 등급 최저가
Seedance 2.0	약 $0.40–0.60	CapCut 유료 플랜에 포함
Veo 3.1	약 $0.60–0.80	Vertex AI / Google AI Studio 청구에 연결
Luma Ray3	약 $0.80–1.20	$10/월 입문, 인간 사실주의 프리미엄
Sora 2(중단)	약 $4–8	1080p에 $200/월 Pro

Sora 2 행은 의도적으로 남겨뒀다. Sora 2와 나머지 사이의 10–20배 비용 격차는 OpenAI 품질 우위의 특징이 아니었다 — 상업적으로 생존 불가능한 아키텍처 선택의 특징이었다. Sora 2가 사라지고 살아남은 범위는 좁고 가격은 수렴하고 있다. 고정 월 예산으로 일하는 크리에이터 팀은 이제 어떤 톱 모델을 골라도 거의 같은 양의 비교 가능한 품질의 출력을 생산할 수 있다.

이번 해는 능력 수렴이 예측되는 것에서 관찰되는 것으로 바뀐 해다. 같은 프롬프트로 Veo 3.1이 만든 클립과 Kling 3이 만든 클립은 이제 품질이 아닌 스타일적 선호로 구별된다.

무엇이 바뀌었나. 가치는 위로 이동했다. 모두가 수렴하는 가격에 비교 가능한 생성기에 접근할 수 있다면, 차별화 요소는 그것을 어떻게 편성하는가가 된다 — 어떤 샷을 어느 모델로 라우팅할지, 그 사이에서 정체성을 어떻게 유지할지, 오디오 호를 어떻게 계획할지, 조립할 때 솔기가 어떻게 사라질지. 그 편성 레이어가 다음 변화이고, 가장 큰 변화이기도 하다.

변화 4 — Prompt engineering은 죽고 에이전트 레이어가 인계받았다

"Prompt engineering"은 2024년 모든 채용 공고에 있었고 2025년 대부분의 AI 후보 프로필의 특화 스킬이었다. 2026년 5월에는 시대착오적으로 읽힌다 — 2020년 이력서에 "HTML 개발자"라고 쓰는 것처럼. 그것이 묘사한 스킬은 실재했지만, 직무가 옮겨갔다.

대체는 에이전트다. 2026년에 크리에이터는 의도를 일상어로 영상 에이전트에게 설명한다. 에이전트는 브리프를 비트로 분해하고, 위 레인 표에서 각 비트를 가장 적절한 기저 모델로 라우팅하며, 잠긴 캐릭터 참조를 생성해 모든 샷에서 재사용하고, 보이스오버와 음악을 단일 연속 호로 계획하며(섹션별 아님), 결과를 조립해 대상 플랫폼용으로 내보낸다. 크리에이터는 크리에이티브 디렉션 수준에 머무른다; 에이전트가 실행을 처리한다. 2023–2025를 정의한 "완벽한 프롬프트를 써라" 워크플로는 출력 양에 진지한 모든 팀에 의해 은퇴됐다.

이렇게 된 구조적 이유는 단순하다: 다른 레인의 여섯 상품 모델(변화 3)이 있으면, 인간이 쓴 프롬프트는 어떤 모델이 대화 vs 양식화 vs 참조 무거운 샷을 처리하는지 알고 그에 따라 라우팅하는 에이전트와 경쟁할 수 없다. 10분짜리 작품을 위해 60+ 생성에 걸쳐 그 라우팅을 수동으로 돌리는 인지 부담이 멀티툴 워크플로를 죽인 것이다. (엔지니어링 세부사항은 장편 AI 영상 필드 가이드가 에이전트 레이어가 흡수하는 문제 중 프롬프트가 할 수 없는 것들을 정확히 짚는다.)

고용 시장 신호는 구체적이다. "Prompt engineer" 역할 채용 공고는 2024년 중반에 정점을 찍고 2025년 Q4 이후 감소 중이다. "AI workflow operator", "AI production lead", "AI agent operator" — 명시적으로 에이전트 레벨 운영을 묘사하는 역할 — 의 채용 공고는 같은 기간에 빠르게 성장했다. 스킬의 무게중심이 영리한 표현에서 시스템 편성으로 옮겨가고 있다.

무엇이 바뀌었나. 제작 속도와 품질이 동시에 점프했고, 같은 축인 편성 위에서 점프했다. 2026년 중반에 가장 많이 시청되는 AI 영상을 만드는 크리에이터는 반드시 가장 좋은 프롬프트 작성자가 아니다 — 가장 좋은 에이전트를 쓰는 사람이다. 2026년 중반에 프롬프트 스킬로 채용하는 팀은 전임자들이 생각한 양으로는 더 이상 존재하지 않는 직무를 위해 채용하고 있다.

변화 5 — 캐릭터 일관성이 병목이 아니게 됐다

2024년과 2025년 대부분 동안, 장편 AI 프로젝트를 깨뜨린 단일 불만은 "샷 사이에서 캐릭터의 얼굴을 일관되게 유지할 수 없다"였다. 그 현상은 크리에이터 서클에서 이름이 있었다 — "drift" — 그리고 민속 법칙: 3분이면 주인공은 다른 사람이 된다. 다큐멘터리는 거기서 실패했다. 세로형 드라마 시리즈는 거기서 실패했다. 장편 카테고리 전체가 그것에 막혀 있었다.

2026년 5월 기준 drift는 더 이상 불만이 아니다. 정체성 지속 — 에피소드 간, 촬영 일 간, 모델 경계 간 — 은 이제 모든 에이전트 주도 파이프라인의 기본 요건이다. 단일 잠긴 참조가 세로형 드라마 80화, 다큐멘터리 60 생성, 또는 수개월 브랜드 캠페인에 걸쳐 가시적 저하 없이 재사용된다.

이를 해결한 기술 메커니즘은 단일 모델 위에 있지 않다. 모델 랩들이 혜택을 봤다(단일 8초 생성 안에서 지속을 유지하려는 시도를 그만둘 수 있었다), 하지만 격차를 메운 것은 모델 위의 에이전트 레이어다. 에이전트는 정체성 토큰을 보유하고, 생성 사이에서 그것을 운반하며, 토큰을 잃지 않고 기저 모델 사이를 전환하고, 매 출력마다 결과의 drift를 재확인한다. 이는 기저 생성기가 Veo, Seedance, Kling, HappyHorse 어느 것이든 작동한다.

이제 가능한 것에 대한 함의:

포맷	2026 이전	2026 중반
80화 세로형 드라마	$150K–$300K 실사; AI 시도는 10화에서 가시적으로 무너짐	솔로 팀, 약 6주, 5자리 낮은 자릿수, 80화 내내 정체성 유지
10분 다큐멘터리	아카이브 + 인터뷰 앵커가 있어야만 가능	단독 크리에이터, 3–5 영업일, 60+ 생성 동안 정체성 유지
다주 브랜드 캠페인	캐릭터 유지를 위해 매칭된 실사 촬영 필요	에이전트가 브랜드 잠긴 AI 캐릭터를 수주 생성에 걸쳐 유지

무엇이 바뀌었나. 장편이 실현 가능해졌다. 캐릭터 지속 없이 AI 영상은 구조적으로 단편 매체였다 — 60초 클립과 고립된 장면. 그것과 함께 장편 카테고리 전체가 인디 팀에 열렸다. 변화 6의 제작비 변화 대부분은 이 단일 기술적 잠금 해제의 하류 효과다.

변화 6 — 제작비가 한 자릿수 무너졌다

세로형 드라마 숫자는 공개되고 극적이라 가장 많이 인용된다: 시리즈당 $150K–$300K의 실사 제작 예산이 동일한 70–100화 길이에 대해 5자리 낮은 자릿수에 안착하는 AI 파이프라인으로 대체됐다. 같은 변화가 더 조용히 익스플레이너, 브랜드 광고, 토킹헤드 콘텐츠, 애니메이션 단편에도 적용된다. 모든 영상 예산을 지배하던 비용 항목이 이제 AI 주도 파이프라인의 총 프로젝트 지출에서 한 자릿수 퍼센트로 돌아간다.

포맷별 제작비 변화에 숫자를 입히면:

포맷	2024 실사 예산	2026 AI 파이프라인 예산	감소
80화 세로형 드라마 시리즈	$150K–$300K	$10K–$25K	~10–15×
10분 익스플레이너	$8K–$30K	$300–$1,500	~20×
30초 브랜드 광고	$30K–$200K+	$1K–$5K	~20–40×
5분 애니메이션 단편	$20K–$80K(애니메이션 스튜디오)	$500–$2,500	~30×

중요한 단서가 테이블 위에 있어야 한다 — 비용 붕괴가 실제로 크리에이터 이코노미 스토리로 복합되는지를 결정하는 줄이기 때문이다: 유료 획득 비용은 떨어지지 않았다. Meta와 TikTok 광고 CPM은 전년 대비 대체로 평탄하다. AI 제작 영상이 청중을 찾는지를 결정하는 구속력 있는 제약은 여전히 그 뒤의 광고 지출이며, 세로형 드라마 시리즈에서 히트를 찾으려면 여전히 $200K–$1M 범위다. 제작 라인은 10–40배 떨어졌고; 분배 라인은 떨어지지 않았다. (인디 팀이 ReelShort/DramaBox 모델을 돌리려 할 때 정확히 어떻게 작동하는지를 ReelShort 플레이북에서 풀어냈다.)

히트율 산수는 그에 따라 변했다. 2024년에 인디 팀이 단일 실사 세로형 드라마 시리즈를 현실적인 생존 가능성으로 돌리려면 대략 $200만의 운영 자본이 필요했다(한 번의 $150K 제작 시도 + 유료 획득; 단일 실패 시도는 구조적으로 치명적). 2026년에 같은 인디 팀은 비슷한 예산으로 연 8–12 시도를 출하할 수 있다, 각 시도가 ~10–15배 적은 비용이기 때문이다. 히트 주도 카테고리는 시도 수를 보상한다. 누가 게임을 할 수 있는지의 산수가 변했다 — 조용히, 하지만 완전히.

무엇이 바뀌었나. 누가 제작을 시도할 수 있는지의 경제학이 재편됐다. 단일 실사 시도조차 감당 못 하던 인디 팀이 이제 시도 포트폴리오를 돌릴 수 있다. 옛 고정비 해자에서 혜택을 보던 스튜디오는 그것을 잃었다. 산업 정상의 자본 집중(2010년대 스트리밍에 작동한 모델)이 가장자리의 자본 단편화로 대체되고 있다.

이 여섯 변화가 합쳐서 의미하는 것

합쳐 읽으면, 이것은 여섯 개의 독립적 이야기가 아니다. 하나의 이야기를 여섯 각도에서 말한 것이다: AI 영상의 무게중심은 모델에서 그 위의 편성 레이어로 옮겨갔다. 운영의 순서는 인과적이다:

Sora 2가 무너졌다(변화 1) — 분야에서 "모두를 다스리는 하나의 모델" 명제를 제거했다.
중국 모델이 톱 레인을 가져갔다(변화 2) — 단일 리더 모델을 다극 모델로 대체했다.
모델 레이어가 상품화됐다(변화 3) — "최고"와 "충분히 좋다"의 격차를 크리에이터 출력을 차별화하지 못하는 띠 안으로 밀었다.
Prompt engineering이 죽고 에이전트 레이어가 떠올랐다(변화 4) — 다극 모델 레이어에서는 어떤 인간도 에이전트보다 빠르게 모델 사이를 라우팅할 수 없기 때문이다.
캐릭터 일관성이 병목이 아니게 됐다(변화 5) — 모델 사이에서 정체성 토큰을 보유하는 에이전트 레이어가, 어떤 개별 모델도 풀 수 없었던 것을 풀었기 때문이다.
제작비가 한 자릿수 무너졌다(변화 6) — 저렴한 상품 모델 + 작동하는 에이전트가, 어떤 실사 워크플로도 매치할 수 없는 분당 비용 구조를 만들기 때문이다.

2026년에 크리에이티브 팀을 만들고 있다면, 실용적 요점은 "우리는 Veo와 Kling과 Seedance에 접근할 수 있다"가 더 이상 의미 있는 능력 주장이 아니라는 것이다. 모든 팀이 접근 가능하다. 월 10편의 쓸 만한 영상을 출하하는 팀과 1편 출하하는 팀을 가르는 것은, 브리프와 모델 사이의 에이전트 인프라다.

2026년 남은 기간에 무엇을 의미하는가

이 여섯 변화에서 세 가지 재정렬이 따라온다. 각각이 2025년에 작동했고 2026년 상반기 어느 시점에 작동을 멈춘 것을 대체한다.

1. 모델 순위 매기기를 멈추고 라우팅 시작하라

당신의 팀이 여전히 스택의 "최고 모델"을 고르려 내부 평가를 돌리고 있다면, 2025년이라면 보상했을 그러나 2026년이 보상을 멈춘 에너지를 쓰고 있는 것이다. Arena 리더보드는 정보가 되지만, 실제 질문은 어떤 모델 조합이 — 에이전트로 라우팅된 — 대화·참조·양식화·언어에 걸친 당신의 제작 필요에 맞는가이다. 멀티 모델 에이전트 스택은 이제 단일 모델 스택을 비용·속도·품질에서 동시에 이긴다. 12개월 전에 작동했던 "Veo로 표준화" 또는 "Kling으로 표준화" 접근에 남은 논거는 없다.

2. 크리에이티브 디렉션으로 채용하라, 프롬프트 스킬이 아니라

출력의 병목은 더 이상 "누군가 좋은 프롬프트를 쓸 수 있나"가 아니다. "누군가 무엇을 만들지에 대한 명확한 비전이 있나"이다. 채용 신호로서의 프롬프트 엔지니어링은 팀이 잘못된 문제를 풀고 있다는 선행 지표다. 크리에이티브 판단·취향·편집 규율로 승진시켜라. 에이전트 운영으로 훈련시켜라 — 더 빨리 배울 수 있고 정착할 플랫폼에 더 특화돼 있다.

3. 포트폴리오 규모로 제작을 계획하라

비용 붕괴는 많은 것을 시도하고 대부분을 죽일 여유가 있다는 뜻이다. 2026년 남은 기간을 가져갈 팀은 연 8–12 시도를 출하하고 데이터에서 배우는 팀이지, 단일 텐트폴 프로젝트에 분기 예산을 거는 팀이 아니다. 히트 주도 카테고리 — 세로형 드라마, 소셜 커머스, 브랜드 콘텐츠 — 는 시도 수를 보상한다. 그에 따라 계획하라: "시도당 제작비"와 "승자당 유료 획득 지출"을 분리하고, 단일 예산 줄에서 섞지 마라.

결론

2026년 첫 5개월이 하나의 큰 놀라움을 전한 것은 아니다. 합쳐서 산업을 2025년 기반에서 옮긴 여섯 가지 구조적 변화를 전했다. 모델 레이어는 더 이상 제품이 아니다. 에이전트 레이어가 그것이다. Sora 2의 붕괴와 HappyHorse 1.0의 48시간 만의 익명에서 1위로의 부상은 무관한 이야기가 아니다 — 같은 이야기를 한 번은 실패 쪽에서, 한 번은 성공 쪽에서 말한 것이다. 이기는 모델은 가장 좋은 모델이 아니다. 어떤 모델을 골라야 할지 아는 에이전트 안에서 가장 좋은 모델이다.

당신의 AI 영상 스택이 여전히 모델 선택을 핵심 결정으로 다루고 있다면, 2026년 시장에서 2025년 플레이북을 돌리고 있는 것이다. 그것은 고칠 수 있다. 올해 하반기를 가져갈 팀의 대부분이 이번 분기에 그 수정을 하고 있다.

FAQ

2026년 상반기 AI 영상의 가장 큰 단일 사건은 무엇이었나?

3월 24일에 발표되고 4월 26일에 발효된 Sora 2 종료. 제품은 소비자 제공으로 84일 지속됐고, 약 600:1의 비용/매출 비율(추론 일 $1500만 대 누적 매출 $210만)을 태웠으며, 계획됐던 $1B 디즈니 IP 계약을 함께 끌어내렸다. 하류 효과 — 능력 수렴과 가치의 에이전트 레이어로의 이동 — 가 구조적 변화다.

2026년 중국 AI 영상 모델은 정말 정상에 있나?

그렇다, 일반화로서가 아니다. 구체적으로: Kling 3.0(Kuaishou)이 양식화·애니메이션 선두; Seedance 2.0(ByteDance)이 참조 기반 브랜드 영상 선두이고 CapCut으로 약 5억+ 사용자에게 배포; HappyHorse 1.0(알리바바 ATH AI Innovation Unit, 장디 주도)이 중국어 단편 드라마 선두이며 4월 7일 익명 출시 48시간 안에 Arena 리더보드 정상에 올랐다. 글로벌 사용 톱 6 프로덕션 등급 모델 중 셋이 이제 중국제다.

2026년 중반에 prompt engineering은 여전히 유용한 스킬인가?

완성 영상 제작에는 아니다 — 에이전트가 그 일을 크게 흡수했고 "prompt engineer" 채용 공고는 2025년 Q4부터 감소 중이다. 연구·평가·엣지 케이스 실험에는 프롬프트 스킬이 여전히 중요하다. 그러나 더 이상 제작 출력의 병목이 아니다.

2026년 AI 영상은 실사보다 얼마나 더 저렴한가?

포맷에 따라 대략 10–40×. 80화 세로형 드라마는 $150K–$300K에서 $10K–$25K로 떨어졌다. 30초 브랜드 광고는 $30K–$200K에서 $1K–$5K로. 유료 획득 비용은 떨어지지 않았다.

AI 영상 팀은 지금 무엇에 집중해야 하나?

모델 간 라우팅·캐릭터 정체성 지속·오디오 호 계획·조립을 처리하는 통합 에이전트 레이어를 구축하거나 채택하는 것. 모델 레이어는 상품; 차별화는 한 단계 위에 있다.

모델 레이어가 다시 차별화 요인이 될까?

현재 궤적에서는 가능성 낮다. Sora 2를 죽인 컴퓨트 경제학은 지배적 단일 모델 공급자가 되려는 누구에게나 적용된다. 레인 내 전문화는 계속되겠지만, 한 모델이 전체 스택을 닻으로 잡던 시대는 끝났다.

저자 소개
Chris Sherman은 AI 영상 기술과 크리에이티브 제작 워크플로우를 다룬다. AI 영상 제작 가이드는 @GenraAI 팔로우.