Итоги Google I/O 2026: Veo 4 не вышел — но Gemini Omni и Spark официально вывели на сцену слой агентов
· Chris ShermanДва месяца вся индустрия AI-видео говорила о Veo 4. Он не вышел. То, что Google анонсировал на I/O 2026, оказалось больше и страннее: объединённая мультимодальная модель Gemini Omni, работающий 24/7 в облаке агент Spark, тариф AI Ultra за 100 $, который сбрасывает потребительскую ценовую планку, и ясный сигнал, что Google теперь рассматривает слой агентов как следующее платформенное сражение. Здесь полный разбор.
Сундар Пичаи вчера вышел на сцену Shoreline Amphitheatre и дал индустрии AI-видео то, чего она не ожидала. Veo 4 не было. Не было ни одного заголовка с маркой «Veo». На его месте было нечто стратегически более интересное: Gemini Omni — мультимодальная модель, которая нативно обрабатывает генерацию текста, изображения, аудио и видео в единой системе; Gemini Spark — персональный AI-агент, который живёт в облачной VM и действует от вашего имени 24 часа в сутки; и реструктуризация цен, которая ставит план AI Ultra за 100 $ в центр потребительской ставки Google на AI.
Кейноут переписал сценарий ближайших 12 месяцев AI-видео. Ниже — всё, что анонсировал Google, что это значит на деле, и где индустрия AI-видео стоит наутро после.
Gemini Omni: заголовок, который никто не предсказал
Самым значительным анонсом стал Gemini Omni — новая серия моделей, которую Google описывает как первую по-настоящему объединённую мультимодальную систему генерации компании. Там, где предыдущая линейка Google разделяла возможности между Veo (видео), Imagen (изображения) и другими связанными системами, Omni обрабатывает генерацию текста, изображения, аудио и видео нативно в одной модели.
Первая публичная модель в фреймворке Omni — Omni Flash. Она принимает объединённые входы текста, изображения и аудио и выдаёт короткое кинематографическое видео с синхронизированным звуком. Google продемонстрировал, как пользователи загружают статичное изображение, произносят инструкции вслух и получают обратно анимированную сцену с нативным звуком, который реагирует на произнесённое указание. Редактирование разговорное — вы уточняете клип, говоря, что изменить, вместо того чтобы писать новый промпт и регенерировать с нуля.
Три вещи делают Omni стратегически отличным от линейки Veo:
- Одна модель, а не стек. У Veo 3 уже был нативный звук, но более широкий креативный стек Google всё ещё опирался на цепочку отдельных моделей для генерации изображений, аудиопроизводства и редактирования. Omni сворачивает эту цепочку. Стратегическое следствие: Google считает, что следующий скачок в качестве приходит из совместного обучения по модальностям, а не из дальнейшего масштабирования только видеомоделей.
- Генерация, опирающаяся на мир. Демис Хассабис позиционировал Omni как развитие работы Google DeepMind над моделями мира. Тезис в том, что Omni генерирует видео с более сильной пространственной, временной и физической согласованностью, потому что базовая модель имеет более богатое внутреннее представление мира. Подтвердится ли это на выходе на практике — вопрос, который мы будем измерять в следующем квартале.
- Редактирование как первоклассная возможность. Omni позиционируется не только как генератор, но и как редактор. Разговорное уточнение, замена сцен и операции в стиле ремикса — часть поверхности продукта, а не внешний слой. Это значимое изменение в продуктовой философии, на которое конкурентам придётся реагировать.
Чего Omni сейчас не делает: длинного формата. Omni Flash — короткий формат, и Google прямо сказал, что более длинные и продвинутые производственные рабочие процессы запланированы, но ещё не выпущены. Те, кто надеялся на сквозную генерацию 60-секундного нарратива, продолжают ждать.
Gemini Spark: персональный агент 24/7 в облаке
Если Omni был заголовком, который большинство комментаторов прочли неверно, то Spark — самым недооценённым анонсом.
Gemini Spark — это персональный AI-агент, который живёт на выделенной VM Google Cloud, работает непрерывно и действует от вашего имени через продукты Google и расширяющийся список сторонних сервисов по Model Context Protocol (MCP). Описание продукта собственно от Google: агент, который может «бронировать рестораны, оформлять заказ в Instacart и набрасывать ответы в вашем почтовом ящике, пока вы спите».
Стратегическое значение трудно переоценить. Два года потребительская AI-история Google — это Gemini как чат-бот. Spark — это Google, прямо признающий, что чат-бот был неверной рамкой; правильная рамка — автономный агент, действующий через приложения и во времени. Агент читает ваш почтовый ящик, выполняет действия в ваших инструментах, планирует через сервисы и отчитывается. Пользователь описывает результаты; Spark занимается выполнением.
Это тот же тезис, о котором индустрия AI-видео спорила последний год, применённый к общей продуктивности. Слой агентов больше не ставка стартапа на позиционирование. Теперь это позиционная ставка Google.
Цена здесь важна. Spark заблокирован за новым тарифом AI Ultra за 100 $/месяц и в следующую неделю выходит в бету для подписчиков в США. Уже одна цена сигналит: Google считает, что есть значимая популяция пользователей, готовых платить в девять раз больше, чем за тариф Gemini Pro за 11 $, чтобы получить агента, который действительно что-то делает.
Gemini 3.5: обновление базовой модели
Под анонсами Omni и Spark лежит обновление базовой модели. Gemini 3.5 Flash вчера вышел в приложении Gemini, в Search, Antigravity и Gemini API. Заявление Google: он превосходит Gemini 3.1 Pro в бенчмарках по программированию, агентским и мультимодальным задачам, работая примерно в 4 раза быстрее по скорости выходных токенов сопоставимых фронтирных моделей.
Gemini 3.5 Pro анонсирован, но пока не общедоступен. Он в тестировании и выходит в следующем месяце.
Паттерн по Flash, Pro, Omni и Spark согласован: каждый продукт, анонсированный Google на I/O, построен на дорожке агентских возможностей. Более быстрое следование инструкциям, более длинный эффективный контекст, лучшее использование инструментов и более надёжное многошаговое исполнение. Слой моделей формируется так, чтобы обслуживать слой агентов над ним.
Antigravity 2.0: история для разработчиков
Antigravity — платформа разработки агентов от Google. Вчера она получила обновление 2.0 с фокусом на оркестрации — позволяя разработчикам собирать, планировать и контролировать несколько агентов, которые взаимодействуют друг с другом и с внешними инструментами.
Релевантность для AI-видео косвенная, но реальная. По мере того как всё больше AI-видео-инструментов переходят от обёрток над одной моделью к настоящим оркестрированным конвейерам, базовая инфраструктура для запуска, мониторинга и отладки этих оркестраций становится фундаментальной зависимостью. Antigravity 2.0 — попытка Google владеть этим слоем инфраструктуры так же, как он владеет слоем моделей под ним.
Будут ли независимые разработчики агентов опираться на инфраструктуру Google или строить свою — один из самых интересных открытых вопросов, возникших из этого кейноута. Ответ определяет, сколько агентской экономики захватывает Google и сколько остаётся по-настоящему открытым.
Тариф AI Ultra за 100 $: сброс ценовой планки
Google AI Ultra теперь начинается со 100 $ в месяц, более высокий тариф — 200 $. Предыдущий план Ultra стоил 250 $. Новый начальный уровень включает доступ к бете Gemini Spark, в 5 раз больший лимит использования приложения Gemini по сравнению с тарифом Pro за 20 $, 20 ТБ облачного хранилища и YouTube Premium.
Стратегическое прочтение прямое: Google агрессивно ценит премиальный потребительский AI, чтобы захватить ранних адоптеров, которые определят, как ощущается агентский продукт. За 100 $/месяц Spark теперь напрямую конкурирует с верхней частью тарифов ChatGPT Pro и потребительских планов Claude. Агентская функция — дифференциатор, и это функция, версии которой конкурентам придётся выпустить в ближайшие 12 месяцев, или уступить категорию агентов продуктивности.
Для креаторов и операторов релевантный вопрос: ускоряет ли 100 $/месяц за персонального агента работу значимо. Честный ранний ответ: всё зависит от того, оправдает ли бета Spark ожидания демо. Демо есть демо. Узнаем через 90 дней.
Android XR и Project Aura: аппаратная поверхность
Google также представил новые устройства «интеллектуальных очков», включая Project Aura, умные очки XR-класса, разработанные в партнёрстве с Xreal. В этом году запускаются как минимум три партнёрства по умным очкам, позиционируя Google между аудио-приоритетными Ray-Bans от Meta и полноценными XR-гарнитурами.
AI-угол: они работают на Gemini. Живой визуальный контекст, голосовое взаимодействие и агентское действие — всё носимое. Для AI-видео последствия ниже по течению, но реальные. Носимая камера с контекстом Gemini становится постоянным устройством ввода для создания видео, как для захвата референсов, так и для живой правки на ходу. До того, как это станет важно для производственных рабочих процессов — 18 месяцев. До того, как это станет важно для потребительских демо — ноль месяцев.
Android 17: ОС как слой интеллекта
Обновление Android от Самира Самата позиционировало саму ОС как преобразование «из операционной системы в систему интеллекта». Фрейминг — Gemini понимает контекст между приложениями, предвидит потребности и совершает действия от имени пользователя — это тот же тезис слоя агентов, применённый к мобильной платформе.
Конкретные функции значат меньше, чем фрейминг. Google привержен будущему, в котором слой ОС и слой агентов сворачиваются в единый стек, всё работает на базовых моделях Gemini. Для разработчиков это означает, что дизайн приложений с учётом агентов больше не опциональный паттерн; это базовое допущение, вокруг которого Google строит платформу.
Что не вышло: отсутствие Veo 4
Самый ожидаемый анонс, который не состоялся: Veo 4. Не было ни презентации Veo 4, ни сроков Veo 4, ни явного подтверждения, что Veo отказывается от использования в пользу линии Omni.
Наиболее вероятное прочтение: Google консолидирует усилия по генеративному видео под Omni, а не продолжает параллельную разработку Veo. Omni Flash позиционируется как новая точка старта. Veo 3.1 остаётся вариантом производственного класса для случаев использования, которые Omni Flash пока не покрывает — особенно более длинная одноплановая генерация, вывод 4K и согласованность персонажа через ID-embedding, ни одна из которых пока не поддерживается Omni Flash.
Для более широкой индустрии AI-видео это значимый разворот. Восемнадцать месяцев разговоров «что сделает Veo дальше» сменились на «что такое Omni». Операторам с автоматизацией под Veo придётся оценить, ждать ли созревания Omni для длинного формата или поддерживать производство на Veo 3.1 в обозримом будущем. Вероятно — и то, и другое, параллельно, для разных типов контента.
Что это значит для операторов AI-видео
Шагнув назад от отдельных анонсов, вчера изменились три вещи, которые сформируют AI-видео на следующий год.
Во-первых, модельная стратегия стала запутаннее — и это полезно. Omni — это ставка на объединённую мультимодальность, но Omni Flash только короткого формата. Veo 3.1 по-прежнему выполняет тяжёлую работу для более длинных клипов и более высоких разрешений. Настоящие производственные конвейеры будут использовать оба, маршрутизировать между ними и динамически переключаться по мере созревания Omni. Эта логика маршрутизации живёт в слое агентов.
Во-вторых, мышление в категориях слоя агентов теперь консенсус. Spark — это Google, вслух говорящий, что фрейминг чат-бота был переходным шагом, а место назначения — автономный агент. Каждая потребительская и корпоративная команда AI-продукта, спорившая, строить ли «ассистента» или «агента», получила окончательный ответ. Слой агентов — туда смещается конкуренция.
В-третьих, разговорное редактирование меняет рабочие процессы креаторов. Акцент Omni на редактировании в чате — уточнение клипа путём описания того, что изменить — сворачивает прежний двухэтапный процесс «сгенерировать-потом-отредактировать». Для AI-видео-креаторов это значимое упрощение UX, которое от конкурентов ожидают повторить. Конвейер Genra уже поддерживает разговорную итерацию; ожидайте, что каждая серьёзная AI-видео-платформа выпустит свою версию этого в течение шести месяцев.
Что Genra делает дальше
Несколько честных замет о том, куда Genra движется отсюда.
Omni Flash будет интегрирован, как только станет доступен через Gemini API. Слой агентов, который строит Genra, был спроектирован модельно-независимым именно для того, чтобы добавления вроде Omni становились изменениями бэкенда, а не рабочего процесса. Пользователи увидят более качественный вывод короткого формата, когда логика маршрутизации начнёт выбирать Omni Flash для кадров, в которых он лучше всего. Длинный формат, 4K и случаи высокой согласованности продолжают работать на Veo и Seedance.
Фрейминг Spark как агента, постоянно работающего в облаке 24/7, — самая близкая валидация тезиса о слое агентов, которую мы могли бы попросить. Genra — доменно-специфичный агент для производства видео. Spark — общего назначения агент для личной продуктивности. Они комфортно сосуществуют — так же, как CRM-агент и кодирующий агент сосуществуют с общим помощником продуктивности.
Более крупная конкурентная рамка: теперь, когда Google привержен слою агентов на уровне платформы, вопрос для каждого AI-видео-стартапа больше не «будут ли агенты будущим» — это решено. Вопрос: какие доменно-специфичные агенты станут доверенным выбором в своей категории. Для AI-видео это вопрос, на который Genra построена отвечать.
Ключевые выводы
- Google I/O 2026 не выпустил Veo 4. Главным видео-анонсом стал Gemini Omni — объединённая мультимодальная модель, обрабатывающая генерацию текста, изображения, аудио и видео в единой системе, с Omni Flash в качестве первой публичной модели.
- Gemini Spark — постоянно работающий в облаке 24/7 персональный агент, действующий через продукты Google и сторонние сервисы, подключённые по MCP, — стратегически наиболее значимый анонс. Он привязывает Google к слою агентов как к следующему платформенному сражению.
- Gemini 3.5 Flash вышел вчера; Gemini 3.5 Pro в тестировании на следующий месяц. Каждое обновление основы было оформлено вокруг агентских возможностей, а не просто интеллекта.
- AI Ultra переценён на 100 $/месяц на входе (200 $ верхний тариф), снижен с прежних 250 $ Ultra. Доступ к бете Spark в США ограничен тарифом за 100 $ начиная со следующей недели.
- Antigravity 2.0 расширяет платформу разработки агентов Google инструментами оркестрации — инфраструктурный ход для разработчиков агентов.
- Android XR и умные очки Project Aura, плюс фрейминг «система интеллекта» Android 17, распространяют тезис об агентах на слои железа и ОС.
- Omni Flash только короткого формата. Veo 3.1 остаётся производственным инструментом для более длинного, более высокого разрешения, ID-согласованного видео. Настоящие конвейеры будут маршрутизировать между обоими.
- Разговорное редактирование как первоклассная возможность в Omni — это сдвиг рабочего процесса, который конкурентам нужно будет повторить за шесть месяцев.
- Genra интегрирует Omni Flash, как только станет доступен API, при этом пользователи увидят прирост качества на маршрутизированных коротких кадрах незаметно. Длинный формат, 4K и работы, критичные к согласованности, продолжают идти на Veo и Seedance.
Часто задаваемые вопросы
Объявил ли Google Veo 4 на I/O 2026?
Нет. Анонса Veo 4 не было. Вместо этого Google представил серию моделей Gemini Omni, и Omni Flash — первая публично доступная модель. Наиболее вероятная интерпретация: Google консолидирует работу по генеративному видео под фреймворком Omni, а не продолжает параллельные поколения Veo.
Что такое Gemini Omni?
Gemini Omni — новая объединённая мультимодальная серия моделей Google, способная нативно генерировать текст, изображение, аудио и видео из объединённых входов. Omni Flash — первая публичная модель, ориентированная на короткое видео с синхронизированным нативным аудио и разговорным редактированием.
Что такое Gemini Spark?
Gemini Spark — постоянно работающий в облаке 24/7 персональный AI-агент, который запускается на выделенной VM Google, интегрируется с продуктами Google и 30+ сторонними сервисами через MCP, и совершает действия от имени пользователя — бронирует, заказывает, набрасывает и управляет задачами. Бета выходит подписчикам AI Ultra в США на следующей неделе.
Сколько стоит Google AI Ultra в 2026 году?
Новый стартовый тариф AI Ultra — 100 $ в месяц, снижен с 250 $. Более высокий тариф — 200 $. План за 100 $ включает доступ к бете Gemini Spark, в 5 раз больший лимит использования приложения Gemini, чем у тарифа Pro, 20 ТБ облачного хранилища и YouTube Premium.
Что такое Gemini 3.5 Flash?
Gemini 3.5 Flash — последняя базовая модель Google быстрого уровня, выпущенная 19 мая 2026 года. Google утверждает, что она превосходит Gemini 3.1 Pro в бенчмарках по программированию, агентским и мультимодальным задачам, работая примерно в 4 раза быстрее по скорости вывода сопоставимых фронтирных моделей. Доступна в приложении Gemini, Search, Antigravity и Gemini API.
Что такое Antigravity 2.0?
Antigravity — платформа разработки агентов Google. Релиз 2.0 добавляет инструменты оркестрации, позволяющие разработчикам собирать, планировать и контролировать несколько взаимодействующих агентов. Он нацелен на инфраструктурный слой под агентскими продуктами.
Что Google объявил об умных очках на I/O 2026?
Google представил новые устройства «интеллектуальных очков» класса Android XR, включая Project Aura, разработанный с Xreal. Как минимум три партнёрства по умным очкам запускаются осенью 2026 года, позиционируя Google между аудио-приоритетными очками и полноценными XR-гарнитурами. Все работают на Gemini.
Будет ли Genra интегрировать Gemini Omni?
Да. Genra построена так, чтобы интеграция новой модели была изменением бэкенда, а не изменением рабочего процесса. Omni Flash будет добавлен в логику маршрутизации агента, как только он станет доступен через Gemini API. Пользователи увидят улучшения качества на выходе короткого формата без изменения способа работы.
Доступен ли Veo 3.1 после I/O 2026?
Да. Veo 3.1 остаётся доступным через Google AI Studio и Vertex AI. Он продолжает оставаться вариантом производственного класса для более длинных клипов, вывода 4K и случаев использования, которым нужна согласованность персонажа через ID-embedding — возможностей, которые Omni Flash пока не поддерживает.
Что I/O 2026 значит для AI-видео-креаторов?
Три сдвига. Во-первых, модельная стратегия теперь охватывает Omni для коротких объединённых мультимодальных задач и Veo 3.1 для длинного формата и высокого разрешения — настоящие конвейеры будут маршрутизировать между обоими. Во-вторых, мышление в категориях слоя агентов теперь консенсус на уровне платформы, а не только ставка стартапа на позиционирование. В-третьих, разговорное редактирование становится базовой возможностью, которой все AI-видео-инструменты должны будут соответствовать.
Об авторе
Крис Шерман освещает технологии AI-видео, агентские архитектуры и бизнес креативного производства. Подпишитесь на @GenraAI для продолжающегося освещения ландшафта AI-видео после I/O и слушаний по MiniMax (29 мая).