Робин Ли объявил конец эпохи моделей — ИИ-видео доказывало это месяцами
· Chris ShermanCEO Baidu открыл Create 2026 в Пекине сегодня, сняв вопрос «какая модель лучшая?» с повестки. Для ИИ-видео это лишь официально оформило четырёхмесячный консенсус.
Фраза, переопределившая отрасль
Робин Ли, сооснователь и CEO Baidu, поднялся на сцену Baidu Create 2026 в Пекине 14 мая 2026 года и произнёс фразу, которую будут цитировать до конца года: индустрия ИИ, сказал он, прошла «конкуренцию моделей» и вступила в «эпоху агентов». Он связал это с конкретным предложением — новая метрика должна быть Daily Active Agents (DAA), эквивалентом DAU мобильного интернета в эпоху агентов, с прогнозом глобального DAA, в конечном счёте превышающего 10 миллиардов.
Если вы следили за рынком ИИ-видео последние четыре месяца, ничто из этого не является прогнозом. Это описание.
Sora 2 рухнула за 84 дня под тяжестью стратегии только-модель. HappyHorse 1.0 взяла Arena #1 за 48 часов и мгновенно сжала значимый технический разрыв между передовыми видеомоделями примерно до нуля. Seedance 2.0, Veo 3.1 и утёкшая Gemini Omni сходятся в одной архитектурной конечной точке. Вопрос «какая модель лучшая?» перестал быть интересным где-то между февралём и апрелём. Сегодня Робин Ли стал первым CEO крупной платформы, сказавшим это вслух.
Этот текст о том, что это конкретно значит для ИИ-видео — что сказал Ли, что Baidu фактически выпустила сегодня и почему кейноут о слое приложений в Пекине оказывается самым точным описанием конкурентного ландшафта на вторую половину 2026 года.
Что Ли на самом деле сказал
1. «Теория эволюции ИИ» — трёхслойный сдвиг
Ли изложил то, что назвал «теорией эволюции ИИ»: одновременная трансформация на трёх уровнях. Агенты эволюционируют от пассивных ответчиков к автономным исполнителям, непрерывно обучающимся из окружения. Индивиды эволюционируют от обычных пользователей к «суперлюдям», сосуществующим с ИИ для умножения собственной выработки. Предприятия эволюционируют от человек-человек к смешанным человеко-агентным формациям, действующим как объединённые суперорганизации.
Если убрать риторическую оболочку, суть ясна: миграция ценности уходит от чистой способности модели к слою, который оркеструет способность в результаты. Это слой агентов.
2. Daily Active Agents (DAA) — новая метрика
Ли предложил DAA как наследника DAU эпохи агентов. Аргумент: токены измеряют стоимость, не ценность — это метрика входа, не выхода. Активные агенты измеряют, как часто автономное ПО фактически делает полезную работу за кого-то. Он спрогнозировал, что глобальный DAA может в итоге превысить 10 миллиардов.
3. «Одноразовое ПО» — приложения как одноразовые артефакты
Третья нить: по мере того как затраты на генерацию кода рушатся, барьеры разработки падают и одноразовые приложения становятся жизнеспособными. Пользователи генерируют ПО под одну задачу и выбрасывают. Ли привёл агента кодинга Miaoda от Baidu — генерирующего, по сообщениям, ~90% собственного кода — как работающий пример.
Что Baidu фактически выпустила сегодня
| Продукт | Что | Почему важно |
|---|---|---|
| DuMate | Универсальный агент — флагманский горизонтальный продукт Baidu | Прямой удар по позиционированию Operator/ChatGPT-as-agent от OpenAI |
| Miaoda (app + enterprise) | Агент кодинга, генерирующий ~90% собственного кода | Тезис «одноразового ПО» в конкретной форме |
| Baidu YiJing (обновлён) | Мультиагентная платформа цифровых людей для лайвстрима и генерации видео в реальном времени | Наиболее прямо релевантный для создателей ИИ-видео запуск |
| Famou Agent 2.0 | Самоэволюционирующая платформа агентов | Непрерывно обучающаяся автономия — долгосрочная DAA-ставка |
Интересно для нашей темы — YiJing. Это мультиагентная платформа цифровых людей — то есть система не одна видеомодель с приклеенным чатом, а оркестрационный слой, координирующий нескольких специализированных агентов: один для сценария, один для подачи и липсинка, один для камеры и плана, один для реакции аудитории, один для продуктово-промо-логики. Видеомодель где-то внизу, как взаимозаменяемый компонент.
Почему сейчас, а не полгода назад
- Экономический крах Sora 2. Флагманская потребительская видеомодель OpenAI закрылась за 84 дня. Пост-мортем.
- Мгновенный взлёт HappyHorse 1.0. Унифицированная аудио-видеомодель Alibaba взяла Arena #1 за 48 часов. Обзор.
- Архитектурное сближение. Seedance 2.0, HappyHorse 1.0 и утёкшая Gemini Omni указывают на ту же точку.
- Сжатие цен. Цены топовых видео-API сжались с $0.50/сек (Veo 3.1) до $0.05/сек (HappyHorse 1.0).
Ли не предсказал сдвиг. Он его назвал.
Что эпоха агентов значит для ИИ-видео
1. Вопрос «какую модель использовать?» устарел
Правильный — «какой стек агентов маршрутизирует мою работу к лучшей модели для каждого кадра?». Veo 3.1 может быть лучшим для высокофизичного движения. HappyHorse 1.0 для синхронной речи. Seedance 2.0 для многокадровых последовательностей. Kling 3.0 для стилизованной эстетики. Работа агента — знать и маршрутизировать автоматически.
2. Качество вывода перестаёт зависеть от способности модели
Зависит от качества перевода промпта, разбиения на кадры, управления непрерывностью, верификации синка аудио-видео — того, что сама модель плохо делает.
3. Единица дифференциации смещается с «модели» на «рабочий процесс»
Если вы инструмент, вы не конкурируете на «мы используем Veo 3.1». Вы конкурируете на том, что ваш агент делает поверх Veo 3.1, Seedance 2.0, HappyHorse, Kling, Luma и Runway вместе. Центральный тезис обзора середины 2026.
4. DAA переосмысливает метрику успеха для инструментов авторов
Инструменты, оптимизированные под DAU, толкают пользователя к возне. Оптимизированные под DAA — к делегированию: меньше взаимодействий, больше автономии, больше работы за сессию.
5. «Одноразовые агенты» становятся единицей творческого труда
Вместо постоянного инструмента с устойчивыми настройками у каждого проекта свой агент — собран под бриф, оптимизирован под ограничение, распущен при сдаче.
Что это значит лично для вас
Если вы индивидуальный создатель
Прекратите бенчмарк моделей. Начните бенчмарк рабочих процессов. Полезный вопрос ближайших 60 дней не «HappyHorse лучше Veo для моей работы?» — а «маршрутизирует ли мой инструмент между моделями интеллектуально или я делаю это вручную?».
Если вы строите видеопродукт
Обращайтесь с интеграциями моделей как с конфигурацией, не с кодом. Темп релизов гарантирует, что жёсткое кодирование под конкретную модель — шестимесячная бомба.
Если вы ведёте корпоративную творческую команду
«Смешанные человеко-агентные формации» Ли — не слоган. Это конкретная операционная цель.
Три сигнала для наблюдения отсюда
Сигнал 1: Google I/O 2026 (19–20 мая)
Если Gemini Omni выйдет как унифицированная омни-модель с agent-native интерфейсом, Google неявно поддерживает тот же тезис.
Сигнал 2: Слушание Hailuo/MiniMax (29 мая)
Disney, Warner Bros. и NBCUniversal против MiniMax перед судьёй Blumenfeld 29 мая.
Сигнал 3: Принятие DAA крупными платформами
Смотрите, примут ли OpenAI, Anthropic, Meta или Google DAA (или эквивалентную метрику автономии) в следующих квартальных раскрытиях.
Итог
Самое полезное в кейноуте Ли 14 мая — не то, что он анонсировал новые продукты — DuMate, Miaoda и YiJing — это в форме Baidu ответы на паттерн, который уже был. Самое полезное — он дал имя и метрику сдвигу, который тихо шёл на рынке ИИ-видео четыре месяца.
Слой модели продолжает двигаться. Будет продолжать. Gemini Omni на следующей неделе, Seedance 3 в Q3, что бы ни выпустили Anthropic и Meta до конца года. Ничего не уляжется. Это именно та точка. Когда слой модели в постоянном движении, единственное долговечное место для строительства — на уровень выше, на слое агентов, где рабочие процессы капитализируются и оркестрация улучшается с использованием.
Для ИИ-видео это не спекуляция. Мы работаем по этому тезису с начала 2026, именно поэтому Genra построена как сквозной агент поверх Veo + Seedance, а не как фронтенд к одной модели. Работа агента — маршрутизировать к нужной модели, управлять непрерывностью между кадрами, синхронизировать аудио и движение, выдавать финальный монтаж, не превращая вас в маршрутизирующий движок. Кейноут Ли — самое явное публичное подтверждение этого архитектурного выбора в этом году.
Пять дней до Google I/O. Пятнадцать до слушания MiniMax. Следующие две недели скажут вам, какая часть отрасли согласна с тем, что Ли сказал сегодня в Пекине.
FAQ
Что такое Baidu Create 2026?
Ежегодная конференция разработчиков ИИ Baidu, 13–14 мая 2026 в Пекине. CEO Робин Ли использовал кейноут 14 мая, чтобы объявить эпоху агентов и предложить DAA как новую метрику.
Что конкретно анонсировал Робин Ли?
Четыре продукта: DuMate (универсальный агент), Miaoda app + enterprise (~90% самокода), обновлённую Baidu YiJing и Famou Agent 2.0. Плюс метрика DAA и трёхслойная теория эволюции ИИ.
Что такое Daily Active Agents (DAA)?
Эпоха-агентов-аналог DAU. Измеряет, сколько автономных агентов в день делают полезную работу. Ли проектирует > 10 млрд глобально.
Почему это важно для ИИ-видео?
ИИ-видео доказало тезис эмпирически за четыре месяца.
Что такое «одноразовое ПО» в применении к видео?
Для видео: проектно-специфичные ансамбли агентов вместо постоянных инструментов.
Что мне делать как создателю?
Прекратить бенчмарк моделей в изоляции. Начать с рабочих процессов.
Об авторе
Chris Sherman освещает технологию ИИ-видео и креативные продакшен-процессы. Следите за @GenraAI для прямого освещения Google I/O 2026 (19–20 мая) и слушания MiniMax (29 мая).