I/O 2026 前夜:AI ビデオの本当の5つの問い(5つの新モデルではなく)

· Chris Sherman

Google I/O 2026 まで24時間を切った。ネットは Veo 4 の予想記事で埋め尽くされている。皆が同じ問いをしている:新モデルのスペックは何か?それは間違った問いだ。いま AI ビデオを本当に形作っている5つの問いは、明日どのモデルが勝つかとはほとんど関係がない。

2026年5月18日の夕方。明日の朝、Sundar Pichai がステージに登場して次世代の Veo を発表する。AI ビデオに関わるクリエイター、マーケター、アナリストは皆、同じ Twitter のタイムラインを更新しながらスペックのリークを待っている。

直感に反する見解を一つ:明日の発表はおそらく大したものを変えない。すごくないからではない――まずすごい発表になるだろう。だが、AI ビデオで本当に未解決の問題は、もう「どのモデルがいちばん良い出力か」を越えてしまっている。それらの問題はもう一つ上の層、クリップと完成動画の間のギャップに住んでいる。より良い Veo はそのギャップを埋めない。より良い agent は埋める。

以下は、明日のキーノートより重要な5つの問いだ。読んでから、安心してショーを楽しんでほしい。

問い1:なぜカット間の一貫性はいまだに崩れるのか?

2026年の AI ビデオモデルはどれも、美しい8秒クリップを生成できる。同じプロンプトでもう一度回せば、別の人物、別の商品、別のブランドカラー、別の背景が出てくる。モデルは生成間の記憶を持たない。

単発のシネマティックなショットならそれでいい。実際の動画らしきもの――3アングルのプロダクトデモ、1カット目と4カット目に登場するナレーターのいる広告、固定の講師がいるコースモジュール――をやろうとすると、それが問題のすべてになる。

モデル層の答えは参照画像条件付けだ:キャラクターの写真を3枚アップロードすると、モデルがそれに合わせようとする。成功率はだいたい70%。残り30%が、実際の制作時間が消えていく場所だ。

エージェント層の答えは違う:シーケンス全体を通してエンティティ(人物、商品、環境)ごとに参照セットを維持し、失敗したショットを自動で再生成し、一貫性が重要な場所では seed をロックし、参照をバージョン管理してブランドアセットが何ヶ月もの間安定するようにする。モデルの改善は助けになる。出荷可能にするのはオーケストレーションだ。

明日では解決しないこと:Veo 4 はネイティブの ID-embedding を載せてくるかもしれない。今日より良くなる。だが、月に40本のクリップを8 SKU にまたがって作るマーケターが一貫性を気にしなくて済むようにはならない。

問い2:なぜ「クリップ」がいまだに「完成動画」と取り違えられるのか?

どのモデルデモを見ても、見えるのは同じものだ:単一ショット、完璧な照明、カットなし、字幕なし、音楽なし、プラットフォーム別のフレーミングなし、CTA なし。それはクリップだ。誰かが本気で公開するような動画ではない。

本物の動画――YouTube チャンネル、TikTok のフィード、広告アカウント、商品ページに乗るやつ――には、台本、シーン構成、ナレーション、B-roll、ターゲット言語の字幕、ビートに合わせたカット、最初の3秒のフック、配信先のプラットフォームに合った出力フォーマットがある。モデルはそのうちの1つを担当する。残り10個は誰かの手作業の問題だ。

現状のデフォルトの解決策は、5つのツールを縫い合わせることだ:スクリプトライター、ビデオモデル、音声生成、エディタ、字幕ツール。それぞれが独自の UI、価格、故障モードを持っている。結果、品質に真剣な人にとって「AI ビデオ」はいまだに完成アセット1本あたり数時間かかる。

エージェント層の答えは、パイプライン全体を一つのシステムとして所有することだ。自然言語のブリーフが入って、完成動画が出てくる。Genra は Veo と Seedance の上で動き、間のすべてのステップを処理する。これはワークフローの改善ではない。製品カテゴリそのものが違う。

明日では解決しないこと:Veo 4 はより良いクリップを生成する。クリップから完成までのギャップはそのまま動かない。

2026年5月29日、MiniMax 著作権訴訟が審理段階に入る。実質的判断段階に到達した最初の主要な AI ビデオ著作権案件であり、結果は業界全体が今後何年も付き合うことになる先例を作る。

裁判所に問われている内容には次が含まれる:モデルはライセンスなく著作権付き映像で訓練できるのか?AI 生成のクリップが著作権付きシーンと実質的に類似していた場合、誰が責任を負うのか――モデル提供者、プラットフォーム、それともエンドユーザーか?モデルが何百万本の訓練動画を見ている状態で、「実質的に類似」とはそもそも何を意味するのか?

これが明日のキーノートより重要な理由はひとつ:Veo 4 の発表は製品だ。著作権の判決はあらゆる製品を形作る制約だ。判決が一方向に転べば、西側の AI ビデオプロバイダーがいま暗黙に依拠しているセーフハーバー仮定は組み直しを迫られる。逆方向に転べば、訓練データという堀は本当に防御可能な資産になる。

賢いクリエイターやブランドチームは判決を待っていない。商用 AI ビデオを、防御可能な証跡が必要なものとして扱っている――どのモデルを使ったか、どの参照をアップロードしたか、どの同意を得たか。Genra のパイプラインはこれをデフォルトで記録する。規制の床がこの先も動き続けると想定しているからだ。

明日では解決しないこと:Google は I/O で MiniMax 案件に触れない。Veo 4 がどんなスペックで出ようと、全員の足元の法的地盤は動き続ける。

問い4:完成した AI ビデオは結局どこへ行くのか?

動画を生成した。それで?それは YouTube に 16:9 で、TikTok に 9:16 で、Instagram Reels には自動再生用に字幕を焼き込んで、ランディングページには MP4 埋め込みで、有料広告プラットフォームには最初の3秒をフック別バリアントとして再カットして、メールリストにはホスト型プレイヤーへリンクするサムネイルとして配置されなければならない。

配信先ごとにアスペクト比、長さの上限、ファイルサイズ制限、字幕フォーマット、アクセシビリティ要件、アナリティクス連携が違う。モデルが生成するのは1本のレンダー出力だ。配信作業は別の、より大きな、ほぼ手作業のプロジェクトになる。

これが I/O で誰もデモしない AI ビデオの部分だ。そして、動画がお金を生むか、フォルダの中で眠るかを決める部分でもある。

エージェント層の答えは、配信を一級の出力として扱うことだ。同じブリーフから複数のプラットフォームネイティブなカットを並列に生成し、各サーフェスの実際の挙動に合わせて最適化する――TikTok のアルゴリズムが報いるフック構造は YouTube Shorts とは違うし、Instagram Reels が好む最初のフレームはまた別物だ。

明日では解決しないこと:生成の改善は配信を解決しない。プラットフォームは分断されたままだ。それぞれに合わせる作業量は変わらない。エージェント層がそれを引き受けるか、ユーザーが引き受けるかのどちらかだ。

問い5:AI ビデオはいつコストセンターでなくなるのか?

Google は4月に Veo 3.1 を無料にした。透かしと8秒上限を受け入れるなら、単発クリップ生成のコストは崩壊した。無料モデルはどこにでもある。それなのに、なぜ多くの企業の AI ビデオ予算は伸び続けているのか?

モデルコストが瓶首になったことなど一度もないからだ。瓶首はモデル周りの労働だ:プロンプトエンジニアリング、手作業の繋ぎ込み、一貫性の見守り、プラットフォーム別の切り出し、ステークホルダーとのイテレーションループ、ブランド QA。無料モデルは既に端数誤差レベルだった項目をゼロにするだけで、本当のコスト構造には触れない。

AI ビデオを「実験」から「インフラ」に移した企業は、モデルではなくエージェント層をコストの単位として扱うことでそれを成し遂げた。出荷した完成動画あたりのコストを測り、生成したクリップあたりのコストでは測らない。その数字は、無料モデル万歳というナラティブが示唆するのとは違う結論を指している。

ほとんどのチームにとって、AI ビデオが利益センターに向かう道はこう見える:ブリーフから完成までのパイプラインを一つのツールで所有し、5ツール縫い合わせ税を撲滅し、オペレーター週次の出力を測り、その下でモデル層をコモディティ化させる。モデルコストはゼロに向かう。ユニットエコノミクスを決めるのはエージェント層のコストだ。

明日では解決しないこと:Veo 4 がローンチ時に無料だったとしても、来四半期のあなたの AI ビデオ予算はおそらく増える。膨らんでいるのはモデルの利用量ではない。モデルの周りすべてだ。

より大きな論点

明日のキーノートはいいショーになる。ネイティブ 4K が来る。マルチシーン・ナラティブが来る。より速い生成が来る。Google が出す意味のある改善はすべて取り込んでいく。より良いモデルは、本当に Genra 上のすべての動画を少しずつ良くするからだ。

だが、上の5つの問いはより良いモデルでは答えが出ない。答えを出すのは、より良い agent、成熟していく法的枠組み、そしてデモを生産と取り違えるのをやめる業界だ。

明日キーノートを観たら、戻ってきて自問してほしい:その中に、一貫性、クリップから完成、著作権、配信、本当のユニットエコノミクスの針を本当に動かしたものはあったか?我々の予想:1点目で少し、残りはほぼゼロ。

モデル層はヘッドラインだ。エージェント層は仕事だ。

キーポイント

  • Google I/O 2026 は Veo 4 予想と発表に支配される。モデルは、はるかに高いスタックの中の一層に過ぎない。
  • カット間の一貫性はほぼオーケストレーションの問題で、モデルの問題ではない。ネイティブ ID-embedding は助けにはなるが、月に40本出荷する人のギャップは埋まらない。
  • クリップは完成動画ではない。台本、ナレーション、B-roll、字幕、プラットフォーム別カット、配信はすべてモデルが触れない別個の問題だ。
  • 5月29日の MiniMax 著作権審理は、どの I/O 発表よりも AI ビデオ規制を形作る。運用側は今、来歴ログを始めるべきだ。後ではない。
  • YouTube、TikTok、Instagram、広告、メールにわたる配信の断片化はそれ自体が制作税だ。エージェント層が引き受けるか、ユーザーが引き受けるかだ。
  • 無料モデルは AI ビデオ制作の中で最も安い項目を崩壊させる。本当のユニットエコノミクスはモデルの周りすべて――エージェント層によって決まる。
  • Genra は Veo と Seedance の上で動き、パイプライン全体を一つの agent として処理する。明日のモデルの改善はバックエンドに静かに統合される。5つの本当の問いはその場所に残る。

よくある質問

AI ビデオにおけるエージェント層とは何か?

エージェント層は、ブリーフを配信可能な完成動画に変えるシステムだ。台本、シーン構成、モデル選択、生成、一貫性、ナレーション、編集、字幕、プラットフォーム別出力を扱う。モデル層はクリップを生成する。エージェント層は動画を出荷する。

Veo 4 は AI ビデオの一貫性を解決するか?

部分的に。Veo 4 が期待通りネイティブ ID-embedding を載せれば、単一ショットの一貫性は良くなる。マルチクリップ・マルチショット・ブランド安定の継続的コンテンツパイプライン上での一貫性は、依然オーケストレーション――参照管理、再生成ロジック、seed ロック、バージョン管理――を必要とする。モデルは助ける。仕事をするのは agent だ。

MiniMax 著作権案件とは何か、なぜ重要なのか?

MiniMax 案件は、実質的な審理に到達した最初の主要 AI ビデオ著作権案件で、2026年5月29日に予定されている。判決は、業界全体での訓練データ、モデル出力の責任、実質的類似性の解釈に影響する。結果は西側・アジア双方のプロバイダーの規制を形作る。

Veo 3.1 が無料なのに、なぜ AI ビデオ制作は無料にならないのか?

モデルが高かったことなど一度もないからだ。高いのはモデル周りの労働――プロンプトの反復、手作業の繋ぎ込み、一貫性 QA、プラットフォーム別カット、ステークホルダーとのループだ。無料モデルは一番安い項目を崩壊させるだけ。本当の制作コストはエージェント層に住んでいる。

Genra はどんなモデルを使っているか?

Veo と Seedance。agent が各ショットの要件に応じて使うモデルを選ぶ。ユーザーはやりたいことを記述し、agent がモデル選択とそれ以降のパイプラインを処理する。

Google I/O 2026 はいつ?

2026年5月19–20日。オープニングキーノートは5月19日の米東部 1:00 PM / 米西部 10:00 AM 開始、io.google で無料ライブ配信される。Veo と Gemini の発表は通常、最初の90分以内に出る。

ブランドは AI ビデオの著作権不確実性にどう備えるべきか?

動画ごとに来歴をログする:どのクリップをどのモデルが生成したか、どの参照素材をアップロードしたか、それらの参照にどんな同意やライセンスがあるか。監査証跡を後付けではなく、納品物として扱う。法律の床は今後2年間は動き続ける。

プラットフォーム配信はなぜまだこれほど手作業がかかるのか?

プラットフォームごとにアスペクト比、長さの上限、字幕フォーマット、フックパターン、アルゴリズム上の好みが違うからだ。1本のレンダー出力がすべてのサーフェスで良いパフォーマンスを出すことはまずない。同じブリーフから agent がプラットフォームネイティブなバリアントを生成するか、誰かが手で再カットするかのどちらかだ。


著者について
Chris Sherman は AI ビデオ技術、エージェント・アーキテクチャ、クリエイティブ制作のビジネスを取材している。Google I/O 2026(5月19–20日)と MiniMax 審理(5月29日)の実況は @GenraAI で。