李彦宏宣告"模型竞争时代结束"——AI 视频行业已经悄悄证明了四个月

· Chris Sherman

今天百度 CEO 在北京 Create 2026 开场,把"哪个模型最强"作为关键问题正式作废。对 AI 视频行业,这只是给一个酝酿了四个月的共识盖了章。

这句话重新定义了行业

李彦宏,百度联合创始人兼 CEO,2026 年 5 月 14 日站在北京 Baidu Create 2026 的舞台上,留下了一句今年剩下时间都会被反复引用的话:AI 行业已经走过"模型竞争",进入"agent 时代"。配套提出了一个具体指标——日活智能体(DAA, Daily Active Agents),作为 agent 时代对移动互联网 DAU 的对位概念。他预测全球 DAA 最终会超过 100 亿。

如果你过去四个月一直在看 AI 视频市场,这一切都不是预言,而是对既成事实的描述。

Sora 2 在 84 天里因纯模型路线压垮自己。HappyHorse 1.0 在 48 小时拿下 Arena 第一,瞬间把前沿视频模型之间有意义的技术差距压缩到接近零。Seedance 2.0、Veo 3.1、以及刚刚泄露的 Gemini Omni 都在朝同一个架构终点收敛。"哪个模型最强"这个问题在 2 月到 4 月之间的某个时刻已经停止有趣。今天,李彦宏成为第一个把这件事公开说穿的主要平台 CEO。

本文是关于这件事对 AI 视频意味着什么——李彦宏到底说了什么、百度今天到底发了什么、以及为什么一个在北京举行的关于应用层的主题演讲,恰恰是我们对 2026 下半年竞争格局最准确的描述。

李彦宏到底说了什么

从主题演讲中提炼三件事,全部用他自己的框架。

1. "AI 进化论"——三个层面的同步变革

李彦宏提出了他称之为"AI 进化论"的概念:三个层面的同步转变。智能体从被动回应者进化为持续从环境学习的自主执行者。个体从普通用户进化为与 AI 共生、放大自身产出的"超级个体"。企业从人与人协作进化为人机混合编队,以统一超级组织的形式运行。

剥掉修辞外壳,核心主张很清楚:价值正在从原始模型能力向编排能力(把能力转化为结果的层面)迁移。这就是 agent 层。模型之上的一切——生成什么、何时、由哪个 agent、为哪个用户、服务什么目标——是下一个十年价值所在。

2. 日活智能体(DAA)——一个新指标

李彦宏提出 DAA 作为 DAU 的 agent 时代后继。论据是:token 衡量成本,不是价值——是输入指标,不是输出指标。活跃 agent 反过来衡量自主软件代用户实际完成多少有用工作。他预测全球 DAA 最终超过 100 亿。

无论这个数字是否准确,框架本身重要。DAU 奖励参与(在 app 中花的时间)。DAA 奖励生产性自主(无需用户介入完成的工作)。两者对视频创作工具的设计含义完全不同。

3. "一次性软件"——应用作为可丢弃产物

第三条线索:随着代码生成成本崩塌,软件开发门槛下降,一次性或"可丢弃"应用成为可行。用户为单个任务生成定制软件并在用完后丢弃。李彦宏举了百度的编码 agent 秒哒为例——据称约 90% 的代码由它自己生成。

对视频,类比显而易见。生成 60 秒广告的 agent 不是工具里的一个功能;它是一个临时的、任务特定的构造体,存在期与项目同长。管线拼装、模型路由、输出渲染、agent 解散。

百度今天到底发了什么

四个产品发布,全部被定位为论点的证明,而非独立的产品上市。

产品是什么为什么重要
DuMate通用型 agent——百度的旗舰横向 agent 产品直接对位 OpenAI Operator / ChatGPT-as-agent 定位
秒哒(app + 企业版)编码 agent,约 90% 的代码自己生成"一次性软件"论点的具体化
百度伊景(升级版)多 agent 数字人平台,用于直播与实时视频生成对 AI 视频创作者最直接相关的发布
法慕 Agent 2.0自进化 agent 平台持续学习的自主性是长期 DAA 打法

对我们这条线最有意思的是 伊景。它是一个多 agent 数字人平台——意味着系统不是一个嵌着聊天界面的单一视频模型,而是一个编排层,协调多个专门 agent 进行直播和实时视频生成:一个 agent 负责脚本,一个负责口型同步与表达,一个负责机位与镜头选择,一个负责观众反馈,一个负责商品/促销逻辑。视频模型本身在某个底层,作为可换组件被对待。

如果你想要一个把 agent 时代论应用到视频上的单产品演示,伊景就是。卖点不再是"我们有最好的视频模型",而是"我们在当前最好的视频模型之上编排最好的 agent"。

为什么是现在,而不是六个月前

这个论点已经在技术圈流传一年。让李彦宏 5 月 14 日的演讲成为真正拐点——而不是又一个会议演讲——的是过去四个月堆积的实证。

  1. Sora 2 的经济崩塌。OpenAI 旗舰消费视频模型在 84 天内关闭,因为每日 1500 万美元的推理烧损对应每日 210 万美元的收入——这就是消费规模上押注纯模型路线的结果。见 我们的事后复盘
  2. HappyHorse 1.0 的瞬间登顶。阿里的统一音视频模型在 48 小时内以 15B 参数架构拿下 Arena 第一,证明模型层可在数月内被聚焦团队追平或超越。见评测
  3. 架构收敛。Seedance 2.0、HappyHorse 1.0、泄露的 Gemini Omni 都指向同一终点——支持多模态输入的统一音视频模型。架构商品化时,差异化必须落在别处。
  4. 价格压缩。头部视频 API 价格从 0.50 美元/秒(Veo 3.1)向 0.05 美元/秒(HappyHorse 1.0)压缩。价格相同、视觉相同的模型不能构成护城河。

李彦宏不是预测了这个转变,他是给它命名了。两者差别明确,正是这个差别让这场演讲成为 2026 余下时间的常被引用素材。

Agent 时代对 AI 视频到底意味着什么

如果你把 AI 视频作为工作流的重要部分,有五个具体重新框定需要内化。

1. "我该用哪个模型"已经过时

正确的问题是"我的 agent 栈如何把每一镜路由到最合适的模型"。Veo 3.1 可能最适合高物理动作。HappyHorse 1.0 可能最适合同步语音。Seedance 2.0 可能最适合多镜头叙事。Kling 3.0 可能最适合风格化美学。Agent 的工作是知道哪个对应哪个,并自动路由。如果你还在挑一个模型一条道走到底,你在玩 2024 年的游戏。

2. 输出质量不再由模型能力决定

它由提示词转译质量、镜头分解质量、跨镜头连续性管理、音视频同步校验决定——这些事模型本身都做不好。这些都是 agent 层问题。两个团队用同样的底层模型,会因为 agent 截然不同而产出截然不同的结果。

3. 差异化单元从"模型"转向"工作流"

如果你是一个工具,你不再以"我们用 Veo 3.1"参赛。你以"我们的 agent 在 Veo 3.1、Seedance 2.0、HappyHorse、可灵、Luma、Runway 综合之上做了什么"参赛。这是2026 年中盘点的核心论点,李彦宏的演讲是它的公开背书时刻。

4. DAA 重新定义创作工具的成功指标

为 DAU(参与度)优化的工具推动用户更多调试——更多提示迭代、更多旋钮、更多重新渲染。为 DAA 优化的工具推动用户更多委托——更少交互、更高自主性、每次会话完成更多工作。两种设计哲学不兼容,李彦宏今天加持的是后者。5 月 14 日开始,仍以"在 app 中花的时间"为优化目标的 AI 视频工具被告知:你在追错指标。

5. "一次性 agent"成为创作工作单元

演讲最新颖的框架。不再是带持久设置的常驻工具,每个项目都有自己的定制 agent——为简报组装、为约束优化、交付后解散。对商业视频,这是伊景式多 agent 平台规模化的方式:不是一个超级工具,而是给项目组装专属 agent 编队的基础设施。

这对你具体意味着什么

三个具体情境。

如果你是个体创作者

别再 benchmark 模型,开始 benchmark 工作流。未来 60 天最有用的问题不是"HappyHorse 对我的工作是否比 Veo 强",而是"我现在的工具在模型之间智能路由,还是我在手动路由"。如果你在手动做,你在吸收本应被模型上一层吸收的工作。

如果你在做一个视频产品

把模型接入当作配置而非代码。下周 Omni、Anthropic 接下来发什么、字节 Q3 发什么——模型发布节奏保证硬编码到某个特定模型是六个月内引爆的定时炸弹。把差异化建在 agent 层而非模型层。市场奖励编排深度,不奖励模型选择。

如果你在管企业创作团队

李彦宏的"人机混合编队"不是口号。它是具体的运营目标——小型人类团队监督大规模 agent 舰队,人类角色是判断、简报撰写、质量把关。未来 18 个月的竞争问题是:你的团队能否通过把生产执行委托给 agent,在不增加人头的情况下做出 10 倍产出,同时把创意方向保留在人类手中。不做这个切换的团队会被做了的团队产能压制。

从这里起要盯的三个信号

Agent 时代论现在已被公开说出。三个下游事件将决定它是加速还是停滞。

信号 1:Google I/O 2026(5/19–20)

如果 Gemini Omni 以统一全模态模型 + agent 原生界面(chat 驱动编辑、内联混编、工作流模板)的方式发布,Google 在隐性背书今天李彦宏所讲的同一论点。如果 Omni 只是带 API 的独立视频模型,Google 还在玩模型竞争游戏。Omni 发布的框架本身就告诉你 Google 站在哪一边。

信号 2:Hailuo/MiniMax 听证会(5/29)

Disney、Warner Bros、NBCUniversal 起诉 MiniMax 案于 5/29 在 Blumenfeld 法官面前开庭。如果案件实质性推进,"在多个视频模型间路由的 agent"的法律基础设施会变得复杂——agent 要为它路由到的模型生成的内容负责。Agent 层的经济学走向取决于这件事的结果。

信号 3:主要平台的 DAA 采纳

盯紧 OpenAI、Anthropic、Meta、Google 下一季度披露里是否采用 DAA(或某种等价的自主性指标)。如果他们采用,李彦宏的框架默认胜出。如果他们继续报 token 和 DAU,agent 时代叙事还在争夺。2026 Q2 财报电话会是第一次测试。

结论

李彦宏 5 月 14 日演讲最有用的不是他发了新产品——他确实发了,但 DuMate、秒哒、伊景都是百度形状的对一个早已存在的模式的回应。最有用的是他给一个在 AI 视频市场悄悄发生四个月的转变命了名、定了指标。

模型层会继续动,会持续动。下周 Gemini Omni、Q3 Seedance 3、年内 Anthropic 和 Meta 发的不管什么。没一个会稳定。这恰恰是重点。当模型层处于永久运动状态,唯一能持久建设的位置是高一层——agent 层,工作流在那里复利、编排在那里随使用变好。

对 AI 视频,这不是猜测。我们从 2026 年初就在这个论点上运营,这就是 Genra 被构建为基于 Veo + Seedance 的端到端 agent、而不是单一模型前端的原因。Agent 的工作是路由到正确模型、跨镜头管理连续性、同步音频与动作、交付最终剪辑而不让你成为路由引擎。李彦宏的演讲是我们今年得到的对这个架构选择最明确的公开背书。

距离 Google I/O 五天。距离 MiniMax 听证会十五天。下两周会告诉你行业有多大比例同意李彦宏今天在北京所说。

常见问题

什么是 Baidu Create 2026?

百度年度 AI 开发者大会,2026 年 5 月 13–14 日在北京举行。CEO 李彦宏在 5 月 14 日主题演讲中宣告 AI 行业已从"模型竞争"进入"agent 时代",并提出日活智能体(DAA)作为新的行业定义性指标。

李彦宏到底发了什么?

四个产品:DuMate(通用 agent)、秒哒 app + 企业版(约 90% 代码自生成的编码 agent)、升级版百度伊景多 agent 数字人平台、法慕 Agent 2.0(自进化 agent 平台)。同时提出 DAA 指标,并阐述了智能体/个体/企业三层同步演化的"AI 进化论"。

什么是日活智能体(DAA)?

李彦宏提出的 agent 时代 DAU 对位指标。衡量每日有多少自主 agent 在主动完成有用工作。论据是 token 是输入/成本指标,不是输出/价值指标。李彦宏预测全球 DAA 最终超过 100 亿。

这对 AI 视频具体意味着什么?

AI 视频市场用 2026 头四个月实证验证了 agent 时代论——Sora 2 因纯模型路线崩塌、HappyHorse 1.0 在 48 小时内追平模型质量差距、头部 API 价格压缩 10 倍。李彦宏的演讲是给这一切命名的时刻。

什么是"一次性软件",如何应用到视频?

李彦宏对代码生成成本足够低、用户为单任务组装一次性软件后丢弃的世界的框架。应用到视频:项目专属 agent 编队——为单个项目组装、交付后解散,而非带持久设置的常驻工具。

作为创作者我该做什么?

停止孤立 benchmark 模型,开始 benchmark 工作流。有用的问题不再是"HappyHorse 是否比 Veo 强",而是"我的工具是否在模型之间智能路由"。如果你在手动挑模型,你在吸收本应属于 agent 层的工作。


关于作者
Chris Sherman 长期报道 AI 视频技术与创作生产流程。关注 @GenraAI 获取 Google I/O 2026(5/19–20)与 MiniMax 听证会(5/29)的实时跟进。