李彦宏「モデル時代は終わった」と宣言——AI 動画はそれを4ヶ月密かに証明してきた

· Chris Sherman

百度 CEO は本日北京で Create 2026 の幕を開き、「どのモデルが最強か」を重要な問いから外した。AI 動画にとってこれは4ヶ月育った合意を公式化したにすぎない。

業界を再定義した一文

李彦宏、百度共同創業者兼 CEO は、2026年5月14日に北京 Baidu Create 2026 のステージで、今年の残り中ずっと引用される一文を残した。AI 業界は「モデル競争」を過ぎ「agent 時代」に入った、と。具体的な提案も同時に出した——新指標は Daily Active Agents(DAA, 日次アクティブ Agent) であるべきで、モバイルインターネットの DAU の agent 時代版である。世界 DAA は最終的に100億を超えると予測した。

過去4ヶ月 AI 動画市場を見てきたなら、これは予言ではない。記述だ。

Sora 2 はモデル単独戦略の重さで84日に潰れた。HappyHorse 1.0 は48時間で Arena #1 を取り、フロンティア動画モデル間の有意な技術差を瞬時にほぼゼロに圧縮した。Seedance 2.0、Veo 3.1、そして流出した Gemini Omni はすべて同じアーキテクチャの終点に収束している。「どのモデルが最強か」は2月と4月の間のどこかで興味深い問いでなくなった。本日、李彦宏はそれを公に口にした最初の主要プラットフォーム CEO となった。

本稿はそれが AI 動画にとって具体的に何を意味するか——李彦宏が何を言い、百度が今日何を出荷し、なぜ北京でのアプリケーション層に関する基調講演が2026年下半期の競争風景の最も正確な記述として浮上したか——を扱う。

李彦宏が実際に言ったこと

1. 「AI 進化論」——3層の変革

李彦宏は彼が言うところの「AI 進化論」を提示した:3層の同時変革。Agent は受動的応答者から、環境から継続的に学ぶ自律実行者へ進化。個人 は普通のユーザーから、AI と共存して自らの産出を倍化する「スーパー個人」へ進化。企業 は人間対人間の協力から、人間-agent 混成編隊として統一スーパー組織として動作する形へ進化。

修辞を剥がせば核心は明確:価値はモデル能力そのものから、能力を成果に編成する層へ移っている。それが agent 層だ。モデルの上のすべて——何を、いつ、どの agent が、どのユーザーのために、どのゴールに奉仕して生成するか——が次の十年の価値の在処である。

2. Daily Active Agents(DAA)——新しい指標

李彦宏は DAA を DAU の agent 時代後継として提案。論拠:トークンはコストを測り、価値ではない——入力指標であって出力指標ではない。逆に活発な agent は、自律ソフトウェアがどの程度の頻度で誰かのために実際に有用な仕事をしているかを測る。世界 DAA は最終的に100億を超えると予測した。

3. 「使い捨てソフトウェア」——使い捨て成果物としてのアプリケーション

3つめの糸:コード生成コストが崩壊するにつれ、ソフトウェア開発の障壁が低下し、ワンタイム/「使い捨て」アプリが現実的になる。ユーザーは単一タスクのためにカスタムソフトウェアを生成し、使い終わったら破棄する。李彦宏は百度のコーディング agent 秒哒 を機能例として挙げた——コードの約90%は自身で生成しているとされる。

百度が本日実際に出荷したもの

製品何かなぜ重要か
DuMate汎用 agent——百度の旗艦横展開 agentOpenAI の Operator/ChatGPT-as-agent への直接対抗
秒哒(app + 企業版)コード約90%を自己生成するコーディング agent「使い捨てソフトウェア」論の具体化
百度伊景(更新版)ライブ配信とリアルタイム動画生成のためのマルチ agent デジタルヒューマンプラットフォームAI 動画クリエイターにとって最も直接関連する発表
法慕 Agent 2.0自己進化 agent プラットフォーム継続学習自律性は長期 DAA の手

本稿のテーマで興味深いのは 伊景。マルチ agent デジタルヒューマンプラットフォーム——つまりシステムはチャットインターフェイスをくっつけた単一動画モデルではなく、ライブ配信とリアルタイム生成のため複数の専門 agent を協調させる編成層である:脚本、発話とリップシンク、カメラとショット選択、観客反応、商品/プロモロジック、それぞれに別の agent。動画モデル自身はその下のどこかにあり、交換可能なコンポーネントとして扱われる。

なぜ今なのか、6ヶ月前ではなく

  1. Sora 2 の経済崩壊。OpenAI のフラッグシップ消費向け動画モデルは84日で閉鎖。日次1500万ドルの推論燃焼に対し収入210万ドル。事後検証
  2. HappyHorse 1.0 の瞬時の登頂。アリババの統合音声-動画モデルが48時間で Arena #1。レビュー
  3. アーキテクチャ収束。Seedance 2.0、HappyHorse 1.0、流出 Gemini Omni がすべて同一地点を指す。
  4. 価格圧縮。頂級動画 API 価格が $0.50/秒 (Veo 3.1) から $0.05/秒 (HappyHorse 1.0) へ崩壊。

李彦宏は変化を予測したのではなく、命名した。

Agent 時代が AI 動画にとって意味すること

1. 「どのモデルを使うべきか」は時代遅れに

正しい問いは「私の agent スタックは各カットを最適なモデルに routing するか」だ。Veo 3.1 は高物理動作に最適かもしれない。HappyHorse 1.0 は同期音声に最適かもしれない。Seedance 2.0 はマルチショット sequence に最適かもしれない。Kling 3.0 はスタイル化美学に最適かもしれない。Agent の仕事はその対応を知り、自動で routing することだ。

2. 出力品質はモデル能力次第ではなくなる

プロンプト翻訳の質、ショット分解の質、ショット間の連続性管理、音声-動画 sync 検証——いずれもモデル単体ではうまくできない。これらは agent 層の問題だ。

3. 差別化単位が「モデル」から「ワークフロー」へ

ツールなら「Veo 3.1 を使っている」では戦えない。Veo 3.1、Seedance 2.0、HappyHorse、Kling、Luma、Runway を組み合わせた上で agent が何をするかで戦う。2026年中盤総括の中心論点。

4. DAA はクリエイターツールの成功指標を再定義

DAU 最適化のツールはユーザーを fiddling に押し出す——プロンプト反復、ダイヤル、再レンダー。DAA 最適化のツールは委任を推す——少ない対話、高い自律性、セッションあたりより多くの完了仕事。

5. 「使い捨て agent」が創作の単位になる

持続設定を持つ常駐ツールではなく、各プロジェクトに専用のカスタム agent——ブリーフに合わせて組成し、制約に合わせて最適化、納品時に解散。

これがあなたに具体的に意味すること

個人クリエイターなら

モデルのベンチマークをやめる。ワークフローのベンチマークを始める。今後60日で最も役立つ問いは「HappyHorse は私の仕事で Veo より良いか」ではなく「私の現行ツールはモデル間を賢く routing するか、それとも私が手動でやっているか」だ。

動画プロダクトを作っているなら

モデル統合を設定として扱い、コードとして扱わない。リリースペースは特定モデルへのハードコーディングが6ヶ月のタイマー爆弾であることを保証する。

企業クリエイティブチームを率いているなら

李彦宏の「人間-agent 混成編隊」はスローガンではなく、具体的な運用目標である。

ここから注視すべき3つのシグナル

シグナル 1:Google I/O 2026(5/19–20)

Gemini Omni が agent-native インターフェイスを備えた統合 omni モデルとして出荷されれば、Google は黙示的に同じ論点を支持している。

シグナル 2:Hailuo/MiniMax 公聴会(5/29)

Disney、Warner Bros、NBCUniversal 対 MiniMax が5月29日 Blumenfeld 判事の前で開廷。

シグナル 3:主要プラットフォームの DAA 採用

OpenAI、Anthropic、Meta、Google が次の四半期開示で DAA(または同等の自律性指標)を採用するかを見る。

結論

李彦宏の5月14日基調講演の最も有用な点は、新製品を発表したことではない——DuMate、秒哒、伊景は既にあったパターンへの百度形の応答だ。最も有用な点は、AI 動画市場で4ヶ月密かに起きていたシフトに名前と指標を与えたことだ。

モデル層は動き続ける。動き続ける。来週 Gemini Omni、Q3 Seedance 3、年末まで Anthropic と Meta が出す何でも。何も落ち着かない。それがまさにポイントだ。モデル層が永続運動状態にあるとき、唯一の耐久的建設場所は1階層上——ワークフローが複利化し編成が使用と共に良くなる agent 層だ。

AI 動画にとってこれは推測ではない。我々はこの論点で2026年初頭から運営しており、これが Genra が単一モデルのフロントエンドではなく Veo + Seedance の上のエンド・ツー・エンド agent として構築されている理由だ。Agent の仕事は正しいモデルに routing し、カット間連続性を管理し、音声と動作を同期し、最終カットを納品する——あなたを routing エンジンにせずに——ことだ。李彦宏の基調講演は今年得たこのアーキテクチャ選択への最も明示的な公的支持である。

Google I/O まで5日。MiniMax 公聴会まで15日。次の2週間は業界のどれだけが李彦宏が今日北京で言ったことに同意するかを教えてくれる。

FAQ

Baidu Create 2026 とは?

百度の年次 AI 開発者会議、2026年5月13–14日北京開催。CEO 李彦宏が14日の基調講演で agent 時代を宣告し DAA を新指標として提案。

李彦宏は何を発表したか?

4製品:DuMate(汎用 agent)、秒哒 app+企業版(約90%自己生成のコーディング agent)、更新版百度伊景マルチ agent デジタルヒューマンプラットフォーム、法慕 Agent 2.0。加えて DAA 指標と3層 AI 進化論。

Daily Active Agents(DAA)とは?

Agent 時代の DAU 対応。1日に自律 agent が有用な仕事を実行する回数を測る。李彦宏は世界 DAA が100億超えと予測。

AI 動画にとってなぜ重要か?

AI 動画は2026年最初の4ヶ月で agent 時代論を実証——Sora 2 崩壊、HappyHorse 1.0 が48時間でモデル品質差を埋め、頂級 API 価格10倍圧縮。

「使い捨てソフトウェア」を動画にどう当てはめるか?

動画への適用:常駐ツールではなくプロジェクト固有 agent 編成。

クリエイターとして何をすべきか?

モデルの単独ベンチマークをやめ、ワークフローのベンチマークを始める。


著者について
Chris Sherman は AI 動画技術とクリエイティブ制作ワークフローを取材。Google I/O 2026(5月19–20日)と MiniMax 公聴会(5月29日)期間中のライブカバレッジは @GenraAI で。