리옌훙 '모델 시대는 끝났다' 선언 — AI 비디오는 4개월간 조용히 증명해왔다

· Chris Sherman

바이두 CEO는 오늘 베이징 Create 2026 개막에서 "어떤 모델이 최고인가"를 핵심 질문에서 폐기했다. AI 비디오에 이것은 4개월 묵은 합의에 도장을 찍은 것에 불과하다.

업계를 재정의한 한 문장

바이두 공동창업자 겸 CEO 리옌훙은 2026년 5월 14일 베이징 Baidu Create 2026 무대에서 올해 남은 기간 내내 인용될 한 문장을 남겼다. AI 업계는 "모델 경쟁"을 지나 "agent 시대"에 진입했다는 것. 구체적 제안도 함께 내놓았다 — 새 산업 지표는 모바일 인터넷의 DAU에 대응하는 agent 시대 지표인 Daily Active Agents(DAA)가 되어야 하며, 글로벌 DAA는 최종적으로 100억을 넘을 것이라 예측했다.

지난 4개월간 AI 비디오 시장을 봐왔다면 이 모든 게 예측이 아니다. 기술이다.

Sora 2는 모델 단독 전략의 무게로 84일 만에 무너졌다. HappyHorse 1.0은 48시간 만에 Arena #1을 차지하고 프런티어 비디오 모델 사이의 의미 있는 기술 격차를 거의 0으로 즉시 압축했다. Seedance 2.0, Veo 3.1, 그리고 유출된 Gemini Omni 모두 같은 아키텍처 종착점으로 수렴한다. "어떤 모델이 최고인가"는 2월과 4월 사이 어느 시점부터 흥미로운 질문이 아니게 되었다. 오늘 리옌훙은 이를 공개적으로 말한 최초의 주요 플랫폼 CEO가 되었다.

이 글은 그것이 AI 비디오에 구체적으로 무엇을 의미하는지에 대한 것이다 — 리옌훙이 무엇을 말했고, 바이두가 오늘 실제로 무엇을 출시했으며, 왜 베이징에서 열린 응용 계층에 대한 기조연설이 2026년 하반기 경쟁 풍경에 대한 가장 정확한 기술로 드러나는지.

리옌훙이 실제로 말한 것

1. "AI 진화론" — 3계층 변혁

리옌훙은 자신이 명명한 "AI 진화론"을 제시했다: 3계층의 동시 변혁. Agent는 수동적 응답자에서 환경으로부터 지속적으로 학습하는 자율 실행자로 진화. 개인은 일반 사용자에서 AI와 공존하며 자신의 산출을 곱하는 "슈퍼 개인"으로 진화. 기업은 사람 대 사람 협력에서 사람-agent 혼합 편성이 통합 슈퍼 조직으로 작동하는 형태로 진화.

수사를 벗기면 핵심은 명확하다: 가치 이주는 원시 모델 능력으로부터, 능력을 결과로 편성하는 계층으로 이동하고 있다. 그것이 agent 계층이다. 모델 위의 모든 것 — 무엇이, 언제, 어떤 agent에 의해, 어떤 사용자를 위해, 어떤 목표를 위해 생성되는지 — 가 다음 10년의 가치가 있는 곳이다.

2. Daily Active Agents(DAA) — 새 지표

리옌훙은 DAA를 DAU의 agent 시대 후계로 제안. 논거: 토큰은 비용을 측정하지 가치가 아니다 — 입력 지표지 출력 지표가 아니다. 활성 agent는 반대로 자율 소프트웨어가 누군가를 대신해 얼마나 자주 실제로 유용한 일을 하는지 측정한다. 글로벌 DAA가 최종적으로 100억을 넘을 수 있다고 예측했다.

3. "일회용 소프트웨어" — 폐기 가능한 아티팩트로서의 응용

세 번째 가닥: 코드 생성 비용이 붕괴하면서 소프트웨어 개발 장벽이 떨어지고 일회성 또는 "일회용" 응용이 실행 가능해진다. 사용자는 단일 작업을 위해 맞춤 소프트웨어를 생성하고 폐기한다. 리옌훙은 바이두의 코딩 agent 먀오다를 작동 예시로 인용 — 자체 코드의 약 90%를 생성한다고 한다.

바이두가 오늘 실제로 출시한 것

제품무엇왜 중요
DuMate범용 agent — 바이두의 기함 수평 agent 제품OpenAI Operator/ChatGPT-as-agent 포지셔닝에 직격
먀오다(app + 기업판)자체 코드 ~90% 생성하는 코딩 agent"일회용 소프트웨어" 명제의 구체화
바이두 이징(업데이트)라이브스트리밍과 실시간 비디오 생성을 위한 멀티 agent 디지털 휴먼 플랫폼AI 비디오 크리에이터에 가장 직접 관련된 발표
파무 Agent 2.0자기진화 agent 플랫폼지속 학습 자율성은 장기 DAA 플레이

본 글 주제로 흥미로운 건 이징이다. 멀티 agent 디지털 휴먼 플랫폼 — 즉 시스템은 채팅 인터페이스를 붙인 단일 비디오 모델이 아니라, 라이브스트리밍과 실시간 생성을 위해 여러 전문 agent를 조율하는 오케스트레이션 계층이다: 대본 한 agent, 발화·립싱크 한 agent, 카메라·샷 선택 한 agent, 관객 반응 한 agent, 제품/프로모 로직 한 agent. 비디오 모델 자체는 그 아래 어딘가에서 교체 가능한 컴포넌트로 취급된다.

왜 6개월 전이 아닌 지금인가

  1. Sora 2의 경제적 붕괴. OpenAI 기함 소비자 비디오 모델이 84일에 종료. 사후 분석 참조.
  2. HappyHorse 1.0의 즉각 등정. 알리바바 통합 오디오-비디오 모델이 48시간 Arena #1. 리뷰.
  3. 아키텍처 수렴. Seedance 2.0, HappyHorse 1.0, 유출 Gemini Omni 모두 같은 종착점을 가리킨다.
  4. 가격 압축. 톱티어 비디오 API 가격 $0.50/초(Veo 3.1)에서 $0.05/초(HappyHorse 1.0)로 붕괴.

리옌훙은 변화를 예측한 게 아니라 명명했다.

Agent 시대가 AI 비디오에 의미하는 것

1. "어떤 모델을 써야 하는가"는 진부해졌다

올바른 질문은 "내 agent 스택은 각 샷을 가장 적합한 모델로 라우팅하는가"이다. Veo 3.1은 고물리 동작에 최적일 수 있다. HappyHorse 1.0은 동기 음성에. Seedance 2.0은 멀티샷 시퀀스에. Kling 3.0은 양식화된 미학에. Agent의 일은 어떤 것이 어떤 것에 맞는지 알고 자동 라우팅하는 것이다.

2. 출력 품질은 더 이상 모델 능력에 좌우되지 않는다

프롬프트 번역 품질, 샷 분해 품질, 샷 간 연속성 관리, 오디오-비디오 sync 검증으로 결정된다 — 모델 자체가 잘 못하는 것들. 이것들이 agent 계층 문제다.

3. 차별화 단위가 "모델"에서 "워크플로"로

도구라면 "Veo 3.1 사용"으로 경쟁하지 않는다. Veo 3.1, Seedance 2.0, HappyHorse, Kling, Luma, Runway 조합 위에서 agent가 무엇을 하는지로 경쟁한다. 2026 중반 결산의 중심 명제.

4. DAA는 크리에이터 도구의 성공 지표를 재구성

DAU 최적화 도구는 사용자를 만지작거리게 한다 — 더 많은 프롬프트 반복, 더 많은 다이얼, 더 많은 재렌더. DAA 최적화 도구는 위임을 밀어붙인다 — 더 적은 상호작용, 더 높은 자율성, 세션당 더 많은 완료 작업.

5. "일회용 agent"가 창작 작업 단위로

지속 설정 상주 도구가 아니라, 각 프로젝트마다 맞춤 agent — 브리프에 맞춰 조립, 제약에 맞춰 최적화, 납품 시 해체.

이것이 당신에게 구체적으로 의미하는 것

개인 크리에이터라면

모델 벤치마킹을 멈춰라. 워크플로 벤치마킹을 시작하라. 앞으로 60일 가장 유용한 질문은 "HappyHorse가 내 작업에서 Veo보다 나은가"가 아니라 "내 현재 도구가 모델 간을 지능적으로 라우팅하는가, 아니면 내가 수동으로 하는가"이다.

비디오 제품을 만든다면

모델 통합을 설정으로 다뤄라, 코드로 다루지 마라. 릴리스 속도 — 다음 주 Omni, 다음에 Anthropic, Q3에 ByteDance — 는 특정 모델로의 하드코딩이 6개월 타이머 폭탄임을 보장한다.

기업 크리에이티브 팀을 운영한다면

리옌훙의 "사람-agent 혼합 편성"은 슬로건이 아니다. 구체적 운영 목표다.

여기서부터 주시할 세 가지 신호

신호 1: Google I/O 2026(5/19–20)

Gemini Omni가 agent-네이티브 인터페이스를 갖춘 통합 omni-모달리티 모델로 출시되면 Google은 묵시적으로 동일 명제를 지지한다.

신호 2: Hailuo/MiniMax 공청회(5/29)

Disney, Warner Bros, NBCUniversal 대 MiniMax가 5월 29일 Blumenfeld 판사 앞에서 개정.

신호 3: 주요 플랫폼의 DAA 채택

OpenAI, Anthropic, Meta, Google이 다음 분기 공시에서 DAA(또는 동등 자율성 지표)를 채택하는지 주시.

결론

리옌훙 5월 14일 기조연설의 가장 유용한 점은 새 제품 발표가 아니다 — DuMate, 먀오다, 이징은 이미 있던 패턴에 대한 바이두 모양의 응답이다. 가장 유용한 점은 AI 비디오 시장에서 4개월간 조용히 일어나던 전환에 이름과 지표를 부여한 것이다.

모델 계층은 계속 움직인다. 계속 움직일 것이다. 다음 주 Gemini Omni, Q3 Seedance 3, 연말까지 Anthropic과 Meta가 출시하는 모든 것. 아무것도 안정되지 않을 것이다. 정확히 그것이 요점이다. 모델 계층이 영구 운동 상태일 때, 유일한 내구적 건설 장소는 한 계층 위 — 워크플로가 복리되고 오케스트레이션이 사용과 함께 개선되는 agent 계층이다.

AI 비디오에 이것은 추측이 아니다. 우리는 2026년 초부터 이 명제로 운영해왔고, 그것이 Genra가 단일 모델의 프런트엔드가 아니라 Veo + Seedance 위의 종단간 agent로 구축된 이유다. Agent의 일은 적절한 모델로 라우팅, 샷 간 연속성 관리, 오디오와 동작 sync, 당신을 라우팅 엔진으로 만들지 않고 최종 컷 납품이다. 리옌훙의 기조연설은 올해 받은 이 아키텍처 선택에 대한 가장 명시적인 공개 지지다.

Google I/O까지 5일. MiniMax 공청회까지 15일. 다음 2주가 업계 얼마만큼이 오늘 베이징에서 리옌훙이 한 말에 동의하는지 알려줄 것이다.

FAQ

Baidu Create 2026이 무엇인가?

바이두 연례 AI 개발자 회의, 2026년 5월 13–14일 베이징 개최. CEO 리옌훙이 14일 기조연설에서 agent 시대 선언 및 DAA 새 지표 제안.

리옌훙이 정확히 무엇을 발표했나?

4개 제품: DuMate(범용 agent), 먀오다 app+기업판(자체 코드 ~90% 생성 코딩 agent), 업데이트된 바이두 이징 멀티 agent 디지털 휴먼 플랫폼, 파무 Agent 2.0. 추가로 DAA 지표와 3계층 AI 진화론.

Daily Active Agents(DAA)가 무엇인가?

DAU의 agent 시대 대응. 자율 agent가 하루에 유용한 일을 수행하는 횟수를 측정. 리옌훙은 글로벌 100억 초과 예측.

AI 비디오에 구체적으로 왜 중요한가?

AI 비디오가 2026 첫 4개월에 명제를 실증 — Sora 2 붕괴, HappyHorse 1.0 48시간 격차 좁힘, 톱 API 가격 10배 압축.

"일회용 소프트웨어"는 비디오에 어떻게 적용?

비디오에 적용: 상주 도구가 아닌 프로젝트별 agent 앙상블.

크리에이터로서 무엇을 해야 하나?

모델 단독 벤치마킹 중단, 워크플로 벤치마킹 시작.


저자 소개
Chris Sherman은 AI 비디오 기술과 크리에이티브 제작 워크플로를 취재한다. Google I/O 2026(5월 19–20)과 MiniMax 공청회(5월 29) 라이브 커버리지는 @GenraAI에서.