すでに起きた六つのシフト:2026年中盤AI動画総括

· Genra AI

予測ではない。インベントリだ。すでに業界の動き方となった六つの事実。

あなたがモデルを見ている間に、業界は再編した

もし大晦日に眠って今週目を覚ましたなら、2025年12月版のAI動画は見分けがつかないだろう。Sora 2のロゴはOpenAIのプロダクトページから消えている。Artificial Analysis Video Arenaで最も引用される単一モデルは、8週間前には存在せず、聞いたこともないチームが匿名で投入したものだ。クリエイターフォーラムで支配的な質問は、もはや「どのモデルが最良か」ではない。「どのエージェントを動かすべきか」だ。キャラクター一貫性——2年間あらゆる長尺AIプロジェクトを止めてきたボトルネック——は、誰も宣伝に出さない機能になった。10分のAIドキュメンタリーは、年初なら月面着陸級のデモだったが、いまや単独のクリエイターが1営業週で出荷するものだ。

5か月。六つのシフト。どれも予測ではない。インベントリだ:2026年5月時点で、すでに業界が実際に動いている方式になっているもの。下記、それぞれが何だったか、何が変わったか、その背景にある具体的な出来事と数字、そしてあなたが次に作るものにとって何を意味するか。

シフト1 — Sora 2の崩壊が分野の頂点を再編した

これまでの年最大の単一イベントには日付がある:2025年12月31日(Sora 2がローンチ)、2026年1月10日(10日後に無料層停止)、2026年3月24日(シャットダウン発表)、2026年4月26日(コンシューマアプリとウェブ閉鎖)、2026年9月24日(API終了)。コンシューマプロダクトとして84日。AI動画史上最も誇大広告されたローンチが、単一の会計四半期内で出荷、ピーク、そして折りたたまれた。

主要な数字を一か所で見る価値がある——なぜ崩壊がこれほど速かったか、そしてなぜこれほど多くの資本と信頼を巻き込んだかを説明するから:

指標 Sora 2 業界ベンチマーク
ピーク時の日次推論コスト 約 $1,500万 同等量で1桁下
Soraに帰属する累計収益 約 $210万
コスト/収益比 約 600:1 持続可能なAIツールで <5:1
1080pアクセス $200/月(Pro階級のみ) $5–30/月(Kling、Runway、Seedance)
標準階級の解像度 480p 720p–1080p
無料層の期間 10日後に撤去 継続(制限あり)

ディズニーの損害が金銭的損害をさらに悪化させた。OpenAIとディズニーは、ディズニーアニメーション、マーベル、ピクサー、スター・ウォーズから200以上のキャラクターをカバーする、おおむね10億ドルのIP契約に署名していた——AI動画プロダクトがこれまで並べた中で最大の堀。ディズニーは公開発表の1時間以内に通知されたと報じられている。契約は崩壊した。コンシューマSora事業に関わったOpenAI幹部3名がその後数週で離任した。(完全な事後検証はなぜOpenAIがSoraを殺したかの解説を参照。)

下流効果は多くの観察者の予測通りではなかった。Sora 2ユーザーは単一の代替に移行しなかった。ジョブ別に、予測通りに分かれた:物理重視はVeo 3.1、カメオ風の人物挿入はKling 3、長いストーリーボード化されたシーケンスはSeedance 2、フォトリアル人物作業はLuma Ray3(移行レポートはSoraユーザーがどこへ行ったかで詳細を追う)。「全てを支配する一つのモデル」というフレームはSora 2と共に崩れ、再構築されていない。

これが何を変えたか。リーダーボードはいまやジョブ固有だ。2026年5月にQ1スタイルの「トップモデル」回答はない。正しい問いは、いま撮っているショットにどのモデルが合うかであり、その問いには次第にエージェントが答えるようになっている、クリエイターではなく。単一の英雄モデルがクリエイターのスタックを錨に出来た時代は終わり、戻る可能性は低い——Sora 2を殺した経済(収益$1につき計算$600)はOpenAI固有ではない;単独支配的なモデル提供者になろうとする誰にでも当てはまる。

シフト2 — リーダーボード新トップ、中国製

Sora 2退場の裏側は、中国製モデルが空白を埋めただけでなく——ボードの頂点を取ったことだ。最も明確な実例はHappyHorse 1.0、2026年これまでで最も影響の大きいモデルローンチ。

2026年4月7日、無名のモデルがArtificial Analysis Video Arenaリーダーボードに現れた。プレスリリースなし、チームのロゴなし、公開重みなし。48時間以内にText-to-Videoで首位、Eloは1389——前のリーダーSeedance 2.0より115ポイント上、Image-to-VideoでもEloは1416で首位。4月9–10日、Xアカウント@AthAI_OfficialがこのモデルはアリババのATH AI Innovation Unit製、率いるのは張迪——元Kuaishou VP、Kling AIのアーキテクトと明かした。中国のリーダーのアーキテクトが静かに離脱し、別の中国大手で競合を作り直した。(完全な技術分析はHappyHorse 1.0の解説を参照。)

HappyHorseは見出しだが、唯一のデータではない。2026年5月中旬時点のレーン別の頂点:

レーン リーダー(2026年5月) 所在 理由
様式化 / アニメーション / アニメ近接 Kling 3.0 Kuaishou(中国) ネイティブ4K/60fps、トップ層で最も寛大な無料層
参照素材駆動のブランド・商品動画 Seedance 2.0 ByteDance(中国) マルチモーダル参照システム、CapCut経由で約5億+ユーザーに配布
中国語短編ドラマとCN電商 HappyHorse 1.0 Alibaba(中国) ネイティブ中国語リップシンク、トップ層で最安APIプライス
対話重視、放送グレード Veo 3.1 Google(米国) 48 kHzネイティブオーディオ、プロカラーサイエンス、Extend
フォトリアル人物 / トーキングヘッド Luma Ray3 Luma(米国) 肌のテクスチャ、目の挙動、微表情
ローカル / オンプレ / NDA作業 LTX-2 Lightricks(イスラエル) 単一の高性能コンシューマGPUで安定して動く初のトップ層モデル

これら6リーダーのうち3つが中国製だ。18か月前、この構成は存在しなかった。パターンはナショナリスティックではない——これらのモデルを生み出す才能と資本の流れが安定しているということだ:張迪型のアーキテクト流動性は、Kuaishou、ByteDance、アリババの間でいまや一般的で、ByteDanceのCapCut配布だけで、西側のAI動画スタートアップが対抗できない堀となっている。

これが何を変えたか。モデル層はもはや西側がデフォルトではない。2026年に制作スタックを構築するインディークリエイター、エージェンシー、スタジオは中国モデルを米国モデルと対等に評価しなければならない——多様性チェックではなく、能力と価格上の必要性として。Q1にそれを学んだチームはすでに、コストとケイパビリティ(中国語リップシンク、アニメ近接様式化、$0.50以下の生成)で意味のあるリードを得ており、これは西側モデルが単純に対応できない領域だ。

シフト3 — モデル層がコモディティ化した

シフト2の連れ合いは、「最良」と「十分良い」のギャップが崩壊したことだ。2026年5月までに、トップ6 AI動画モデルすべてがほとんどのユースケースで広く比較可能な単一クリップ出力を生成する。Arenaリーダーボードで#1と#6の間のEloギャップは、2年前にはフロンティアモデルとそれ以外を分けていた帯の中に収まる。実際の専門化はまだある——上のレーン表が列挙している——だが、ギャップはレーンに狭まっており、絶対的なものではない。

価格データは別の角度から同じ話をする。2026年5月、主要モデル全体での1080p、5秒クリップ生成のコスト:

モデル 生成あたりコスト(5秒、1080p) 入門プラン
Kling 3.0 約 $0.20–0.30 $5/月
HappyHorse 1.0 約 $0.25 API のみ、トップ層最安価格
Seedance 2.0 約 $0.40–0.60 CapCut有料プランに同梱
Veo 3.1 約 $0.60–0.80 Vertex AI / Google AI Studio課金に紐付け
Luma Ray3 約 $0.80–1.20 $10/月入門、人物リアル系プレミアム
Sora 2(廃止) 約 $4–8 1080p に $200/月 Pro

Sora 2の行はあえて残してある。Sora 2と他のフィールドの間の10–20倍コストギャップは、OpenAIの品質リードの特徴ではなかった——商業的に存続不能なアーキテクチャ選択の特徴だった。Sora 2が消え、生き残った範囲は狭く、価格は収束している。固定月予算で動くクリエイターチームは、選ぶトップモデルに関わらず、ほぼ同じ量の比較可能品質の出力を生み出せるようになった。

これは能力収束が予測されるのを止め、観測されるようになった年だ。同じプロンプトからVeo 3.1とKling 3が生成したクリップは、いまや品質ではなくスタイル的好みで区別される。

これが何を変えたか。価値は上方へ移動した。皆が収束する価格で比較可能なジェネレーターにアクセスできる場合、差別化要因はそれらをどう編成するかになる——どのショットがどのモデルにルーティングされるか、それらの間でどう同一性が保たれるか、オーディオアークがどう計画されるか、組み立て時に縫い目がどう消えるか。その編成層が次のシフトであり、最大のシフトでもある。

シフト4 — Prompt engineeringは死に、エージェント層が引き継いだ

「Prompt engineering」は2024年のあらゆる求人票にあり、2025年のほとんどのAI採用候補プロファイルでフィーチャースキルだった。2026年5月までに、それは時代錯誤に読める——2020年の履歴書に「HTML開発者」と書くようなものだ。それが描写したスキルはリアルだったが、ジョブが移った。

代替はエージェントだ。2026年、クリエイターは平易な言葉で意図を動画エージェントに伝える。エージェントはブリーフをビートに分解し、上のレーン表から各ビートを最も適切な基底モデルにルーティングし、ロックされたキャラクター参照を生成して全ショットで再利用し、ボイスオーバーと音楽を単一の連続したアークとして計画し(セクションごとではなく)、結果を組み立て、ターゲットプラットフォーム向けにエクスポートする。クリエイターはクリエイティブ・ディレクションのレベルにとどまる;エージェントが実行を扱う。2023–2025を定義した「完璧なプロンプトを書け」ワークフローは、出力量を真剣に追うあらゆるチームによって退役した。

これが起きた構造的理由は単純だ:異なるレーンに6つのコモディティモデルがある状況(シフト3)では、人間が書いたプロンプトは、対話 vs 様式化 vs 参照重視ショットを扱うモデルを把握し、それに応じてルーティングするエージェントと競争できない。10分の作品で60+の生成にわたってそのルーティングを手動で動かす認知負荷こそ、マルチツールワークフローを殺したものだ。(エンジニアリング詳細は長尺AI動画フィールドガイドがエージェント層が吸収する問題のうちプロンプトには出来ないものを正確に説明する。)

労働市場のシグナルは具体的だ。「Prompt engineer」役のリスティングは2024年中頃にピークを打ち、2025年Q4以降減少している。「AI workflow operator」、「AI production lead」、「AI agent operator」——明示的にエージェントレベルの操作を描写する役——のリスティングは同期間で急速に伸びた。スキルの軸足は巧妙な言い回しからシステム編成へ移動している。

これが何を変えたか。制作速度と品質は同時に跳ね、同じ軸——編成——で跳ねた。2026年中盤に最も視聴されるAI動画を制作するクリエイターは、必ずしも最良のプロンプトライターではない——最良のエージェントを使う者だ。2026年中盤にプロンプトスキルで採用するチームは、前任者が思った量ではもう存在しない仕事のために採用している。

シフト5 — キャラクター一貫性はボトルネックでなくなった

2024年と2025年の大半、長尺AIプロジェクトを破壊する単一の苦情は「ショット間でキャラクターの顔を一貫して保てない」だった。この現象はクリエイターサークルで名前があった——「ドリフト」——そしてフォーク律:3分目までに、主人公は別人になっている。ドキュメンタリーはここで失敗した。縦型ドラマシリーズはここで失敗した。長尺カテゴリ全体がこれでボトルネックになっていた。

2026年5月までに、ドリフトは苦情でなくなった。アイデンティティ持続——エピソード越し、撮影日越し、モデル境界越し——はエージェント駆動パイプラインの基本要件となった。単一のロックされた参照は縦型ドラマ80エピソード、ドキュメンタリー60生成、または数か月のブランドキャンペーン全体を可視的劣化なしで再利用される。

これを解決した技術メカニズムは単一モデル上にはない。モデルラボは恩恵を受けた(単一8秒生成内で持続を保とうとするのを止められた)が、ギャップを閉じたのはモデルの上のエージェント層だ。エージェントはアイデンティティトークンを保持し、生成間でそれを運び、トークンを失わずに基底モデル間で切り替え、各出力でドリフトを再チェックする。これは基底ジェネレーターがVeo、Seedance、Kling、HappyHorseのどれであっても機能する。

いま何が可能かの含意:

フォーマット 2026以前 2026年中盤
80エピソード縦型ドラマ $150K–$300K 実写;AI試行は10話で目に見えて崩壊 ソロチーム、約6週、5桁低位、80話全体で同一性保持
10分ドキュメンタリー アーカイブ + インタビューのアンカーがあって初めて実現可能 単独クリエイター、3–5営業日、60+生成で同一性保持
複数週ブランドキャンペーン キャラクター維持に対応する実写撮影が必要だった エージェントがブランドロックされたAIキャラクターを数週の生成にわたって保持

これが何を変えたか。長尺が実現可能になった。キャラクター持続なしでは、AI動画は構造的に短尺メディアだった——60秒クリップと孤立シーン。それと共に、長尺カテゴリ全体がインディーチームに開いた。シフト6で続く制作コストシフトの大半は、この単一の技術的解錠の下流効果だ。

シフト6 — 制作コストが1桁崩壊した

縦型ドラマの数字は公開され劇的なので最も引用される:1作あたり$150K–$300Kの実写制作予算は、同等の70–100エピソード尺で低5桁に着地するAIパイプラインに置き換えられた。同じシフトが、より静かに、解説動画、ブランドCM、トーキングヘッド、アニメ短編にも当てはまる。すべての動画予算を支配していたコスト項目は、AI主導パイプラインではプロジェクト総支出の一桁パーセンテージで動く。

フォーマット間の制作コストシフトに数字を入れると:

フォーマット 2024 実写予算 2026 AIパイプライン予算 削減
80話縦型ドラマシリーズ $150K–$300K $10K–$25K ~10–15×
10分解説動画 $8K–$30K $300–$1,500 ~20×
30秒ブランドCM $30K–$200K+ $1K–$5K ~20–40×
5分アニメ短編 $20K–$80K(アニメスタジオ) $500–$2,500 ~30×

テーブルに置く必要がある重要な但し書きが一つある——なぜならコスト崩壊が実際にクリエイターエコノミーストーリーに複合するかを決める線だからだ:有料獲得コストは下がっていない。MetaとTikTokの広告CPMは前年比でほぼ横ばい。AI制作動画が観客を見つけるかどうかの拘束的制約は、依然としてその背後の広告支出であり、縦型ドラマシリーズでヒットを見つけるには$200K–$1Mの範囲のままだ。制作ラインは10–40倍下落;分配ラインは下がらなかった。(インディーチームがReelShort/DramaBoxモデルを動かそうとする時にこれが正確にどう展開するかをReelShort playbookで解きほぐした。)

ヒット率の数学はそれに応じて変わった。2024年、インディーチームが現実的な存続オッズで単一の実写縦型ドラマシリーズを動かすには大まかに$200万のワーキングキャピタルが必要だった($150K制作試行 + 有料獲得;単一の失敗試行は構造的に致命的)。2026年、同じインディーチームは比較可能な予算で年8–12試行を出荷できる、各試行が約10–15倍少ないコストだから。ヒット駆動カテゴリは試行回数を報いる。誰がゲームをプレイできるかの数学は変わった——静かに、しかし完全に。

これが何を変えたか。誰が制作を試みられるかの経済学が再編した。単一の実写試行を負担できなかったインディーチームが、いまや試行のポートフォリオを動かせる。古い固定費堀から恩恵を受けたスタジオはそれを失った。業界の頂点での資本集中(2010年代ストリーミングで機能したモデル)は、エッジでの資本断片化に置き換えられている。

これら六つのシフトが合算すると

合わせて読むと、これは6つの独立した話ではない。6つの角度から語られる一つの話だ:AI動画の重心はモデルから、その上にある編成層へ移動した。順序は因果的だ:

  1. Sora 2が崩壊した(シフト1)——分野から「全てを支配する一つのモデル」テーゼを取り除いた。
  2. 中国モデルがトップレーンを取った(シフト2)——単一リーダーモデルを多極なものに置き換えた。
  3. モデル層がコモディティ化した(シフト3)——「最良」と「十分良い」の差をクリエイター出力を差別化しない帯に押し込んだ。
  4. Prompt engineeringが死に、エージェント層が登った(シフト4)——多極モデル層では、人間がエージェントよりモデル間で速くルーティング出来ないから。
  5. キャラクター一貫性がボトルネックでなくなった(シフト5)——モデル間でアイデンティティトークンを保つエージェント層が、個別モデルが解けなかったものを解いたから。
  6. 制作コストが1桁崩壊した(シフト6)——安価なコモディティモデル + 機能するエージェントが、いかなる実写ワークフローにもマッチ出来ない毎分コスト構造を生むから。

2026年に創造チームを構築しているなら、実用的な持ち帰りは「VeoとKlingとSeedanceにアクセスできる」がもはや有意な能力主張ではないということだ。すべてのチームがアクセスできる。月10本の使えるビデオを出荷するチームと1本のチームを分けるのは、ブリーフとモデルの間にあるエージェントインフラだ。

2026年の残りに向けて何を意味するか

これら六つのシフトから3つの再方向付けが続く。それぞれが2025年に機能し、2026年前半のある時点で機能しなくなった何かを置き換える。

1. モデルをランクするのを止め、ルーティングし始めろ

あなたのチームがまだスタックの「最良モデル」を選ぶための内部評価を動かしているなら、2025年が報いたであろう、2026年が報いるのを止めたエネルギーを使っている。Arenaリーダーボードは情報的だが、本当の質問は、対話・参照・様式化・言語にまたがる制作ニーズに合うモデル組み合わせ——エージェントによってルーティングされる——は何か、だ。マルチモデルエージェントスタックは、単一モデルスタックをコスト・速度・品質で同時に上回る。12か月前に機能した「Veoで標準化する」または「Klingで標準化する」アプローチに残る議論はない。

2. クリエイティブ・ディレクションで採用、プロンプトスキルではなく

出力上のボトルネックはもはや「誰かが良いプロンプトを書けるか」ではない。「何を作るかについて誰かが明確なビジョンを持っているか」だ。採用シグナルとしてのプロンプトエンジニアリングは、チームが間違った問題を解いている先行指標だ。クリエイティブ判断、味、編集規律で昇進させろ。エージェント運用で訓練しろ——より速く学べ、最終的に決まるプラットフォームに固有だ。

3. ポートフォリオスケールで制作を計画しろ

コスト崩壊は、多くを試みて大半を殺す余裕があることを意味する。2026年の残りを勝ち取るチームは、年8–12試行を出荷しデータから学ぶチームだ、四半期予算を単一の旗艦プロジェクトに賭けるチームではなく。ヒット駆動カテゴリ——縦型ドラマ、ソーシャルコマース、ブランドコンテンツ——は試行数を報いる。それに応じて計画しろ:「試行あたりの制作コスト」と「勝者あたりの有料獲得支出」を分け、単一の予算ラインで混同するのを止めろ。

結論

2026年最初の5か月は一つの大きな驚きを届けたわけではない。合わせると業界を2025年の基盤から動かした六つの構造的シフトを届けた。モデル層はもはや製品ではない。エージェント層がそうだ。Sora 2の崩壊とHappyHorse 1.0の48時間での無名から#1への上昇は無関係な話ではない——同じ話を一度は失敗側、一度は成功側から語ったものだ。勝つモデルは最良のモデルではない。どのモデルを選ぶか知っているエージェント内で最良のモデルだ。

あなたのAI動画スタックがまだモデル選びを中核決定として扱うなら、2026年の市場で2025年のプレイブックを動かしている。それは修正可能だ。今年下半期を所有することになるチームの大半は、この四半期にその修正を行っている。

FAQ

2026年前半のAI動画における最大の単一イベントは何だったか?

3月24日に発表され4月26日に発効したSora 2のシャットダウン。プロダクトはコンシューマ提供として84日続き、おおよそ600:1のコスト/収益比(推論$15M/日に対し$210万の累計収益)で焼け切れ、計画されていた$1Bディズニーの IP契約を巻き込んだ。下流効果——能力収束とエージェント層への価値シフト——が構造的変化だ。

中国製AI動画モデルは本当に2026年に頂点にあるか?

はい、そして一般化としてではない。具体的に:Kling 3.0(Kuaishou)が様式化とアニメで先行;Seedance 2.0(ByteDance)が参照駆動ブランド動画で先行、CapCut経由で約5億+ユーザーに配布;HappyHorse 1.0(アリババのATH AI Innovation Unit、張迪率いる)が中国語短編ドラマで先行、4月7日の匿名ローンチから48時間以内にArenaリーダーボード首位に。グローバル使用のトップ6プロダクショングレードモデルのうち3つが今や中国製。

2026年中盤、prompt engineeringはまだ有用なスキルか?

完成動画の制作には、いいえ——エージェントがその仕事を大きく吸収し、「prompt engineer」求人は2025年Q4から減少している。研究、評価、エッジケース実験では、プロンプトスキルはまだ重要。しかし制作出力上のボトルネックではもうない。

2026年、AI動画は実写よりどれくらい安いか?

フォーマットによりおおよそ10–40×。80話縦型ドラマは$150K–$300Kから$10K–$25Kに低下。30秒ブランドCMは$30K–$200Kから$1K–$5Kに低下。有料獲得コストは下がっていない。

AI動画チームは今、何に焦点を当てるべきか?

モデル間ルーティング、キャラクターアイデンティティ持続、オーディオアーク計画、組み立てを扱う統一エージェント層を構築または採用すること。モデル層はコモディティ;差別化は1段階上に住む。

モデル層は再び差別化要因になるか?

現在の軌道では可能性は低い。Sora 2を殺した計算経済学は、単独支配的な単一モデル提供者になろうとする誰にでも当てはまる。レーン内の専門化は続くが、一つのモデルがスタック全体をアンカーできた時代は終わった。


著者について
Chris ShermanはAI動画技術とクリエイティブ制作ワークフローを取材している。AI映像制作のさらなるガイドは @GenraAI をフォロー。