Итоги Google I/O 2026: Veo 4 не вышел — но Gemini Omni и Spark официально вывели на сцену слой агентов

Два месяца вся индустрия AI-видео говорила о Veo 4. Он не вышел. То, что Google анонсировал на I/O 2026, оказалось больше и страннее: объединённая мультимодальная модель Gemini Omni, работающий 24/7 в облаке агент Spark, тариф AI Ultra за 100 $, который сбрасывает потребительскую ценовую планку, и ясный сигнал, что Google теперь рассматривает слой агентов как следующее платформенное сражение. Здесь полный разбор.

Сундар Пичаи вчера вышел на сцену Shoreline Amphitheatre и дал индустрии AI-видео то, чего она не ожидала. Veo 4 не было. Не было ни одного заголовка с маркой «Veo». На его месте было нечто стратегически более интересное: Gemini Omni — мультимодальная модель, которая нативно обрабатывает генерацию текста, изображения, аудио и видео в единой системе; Gemini Spark — персональный AI-агент, который живёт в облачной VM и действует от вашего имени 24 часа в сутки; и реструктуризация цен, которая ставит план AI Ultra за 100 $ в центр потребительской ставки Google на AI.

Кейноут переписал сценарий ближайших 12 месяцев AI-видео. Ниже — всё, что анонсировал Google, что это значит на деле, и где индустрия AI-видео стоит наутро после.

Gemini Omni: заголовок, который никто не предсказал

Самым значительным анонсом стал Gemini Omni — новая серия моделей, которую Google описывает как первую по-настоящему объединённую мультимодальную систему генерации компании. Там, где предыдущая линейка Google разделяла возможности между Veo (видео), Imagen (изображения) и другими связанными системами, Omni обрабатывает генерацию текста, изображения, аудио и видео нативно в одной модели.

Первая публичная модель в фреймворке Omni — Omni Flash. Она принимает объединённые входы текста, изображения и аудио и выдаёт короткое кинематографическое видео с синхронизированным звуком. Google продемонстрировал, как пользователи загружают статичное изображение, произносят инструкции вслух и получают обратно анимированную сцену с нативным звуком, который реагирует на произнесённое указание. Редактирование разговорное — вы уточняете клип, говоря, что изменить, вместо того чтобы писать новый промпт и регенерировать с нуля.

Три вещи делают Omni стратегически отличным от линейки Veo:

Одна модель, а не стек. У Veo 3 уже был нативный звук, но более широкий креативный стек Google всё ещё опирался на цепочку отдельных моделей для генерации изображений, аудиопроизводства и редактирования. Omni сворачивает эту цепочку. Стратегическое следствие: Google считает, что следующий скачок в качестве приходит из совместного обучения по модальностям, а не из дальнейшего масштабирования только видеомоделей.
Генерация, опирающаяся на мир. Демис Хассабис позиционировал Omni как развитие работы Google DeepMind над моделями мира. Тезис в том, что Omni генерирует видео с более сильной пространственной, временной и физической согласованностью, потому что базовая модель имеет более богатое внутреннее представление мира. Подтвердится ли это на выходе на практике — вопрос, который мы будем измерять в следующем квартале.
Редактирование как первоклассная возможность. Omni позиционируется не только как генератор, но и как редактор. Разговорное уточнение, замена сцен и операции в стиле ремикса — часть поверхности продукта, а не внешний слой. Это значимое изменение в продуктовой философии, на которое конкурентам придётся реагировать.

Чего Omni сейчас не делает: длинного формата. Omni Flash — короткий формат, и Google прямо сказал, что более длинные и продвинутые производственные рабочие процессы запланированы, но ещё не выпущены. Те, кто надеялся на сквозную генерацию 60-секундного нарратива, продолжают ждать.

Gemini Spark: персональный агент 24/7 в облаке

Если Omni был заголовком, который большинство комментаторов прочли неверно, то Spark — самым недооценённым анонсом.

Gemini Spark — это персональный AI-агент, который живёт на выделенной VM Google Cloud, работает непрерывно и действует от вашего имени через продукты Google и расширяющийся список сторонних сервисов по Model Context Protocol (MCP). Описание продукта собственно от Google: агент, который может «бронировать рестораны, оформлять заказ в Instacart и набрасывать ответы в вашем почтовом ящике, пока вы спите».

Стратегическое значение трудно переоценить. Два года потребительская AI-история Google — это Gemini как чат-бот. Spark — это Google, прямо признающий, что чат-бот был неверной рамкой; правильная рамка — автономный агент, действующий через приложения и во времени. Агент читает ваш почтовый ящик, выполняет действия в ваших инструментах, планирует через сервисы и отчитывается. Пользователь описывает результаты; Spark занимается выполнением.

Это тот же тезис, о котором индустрия AI-видео спорила последний год, применённый к общей продуктивности. Слой агентов больше не ставка стартапа на позиционирование. Теперь это позиционная ставка Google.

Цена здесь важна. Spark заблокирован за новым тарифом AI Ultra за 100 $/месяц и в следующую неделю выходит в бету для подписчиков в США. Уже одна цена сигналит: Google считает, что есть значимая популяция пользователей, готовых платить в девять раз больше, чем за тариф Gemini Pro за 11 $, чтобы получить агента, который действительно что-то делает.

Gemini 3.5: обновление базовой модели

Под анонсами Omni и Spark лежит обновление базовой модели. Gemini 3.5 Flash вчера вышел в приложении Gemini, в Search, Antigravity и Gemini API. Заявление Google: он превосходит Gemini 3.1 Pro в бенчмарках по программированию, агентским и мультимодальным задачам, работая примерно в 4 раза быстрее по скорости выходных токенов сопоставимых фронтирных моделей.

Gemini 3.5 Pro анонсирован, но пока не общедоступен. Он в тестировании и выходит в следующем месяце.

Паттерн по Flash, Pro, Omni и Spark согласован: каждый продукт, анонсированный Google на I/O, построен на дорожке агентских возможностей. Более быстрое следование инструкциям, более длинный эффективный контекст, лучшее использование инструментов и более надёжное многошаговое исполнение. Слой моделей формируется так, чтобы обслуживать слой агентов над ним.

Antigravity 2.0: история для разработчиков

Antigravity — платформа разработки агентов от Google. Вчера она получила обновление 2.0 с фокусом на оркестрации — позволяя разработчикам собирать, планировать и контролировать несколько агентов, которые взаимодействуют друг с другом и с внешними инструментами.

Релевантность для AI-видео косвенная, но реальная. По мере того как всё больше AI-видео-инструментов переходят от обёрток над одной моделью к настоящим оркестрированным конвейерам, базовая инфраструктура для запуска, мониторинга и отладки этих оркестраций становится фундаментальной зависимостью. Antigravity 2.0 — попытка Google владеть этим слоем инфраструктуры так же, как он владеет слоем моделей под ним.

Будут ли независимые разработчики агентов опираться на инфраструктуру Google или строить свою — один из самых интересных открытых вопросов, возникших из этого кейноута. Ответ определяет, сколько агентской экономики захватывает Google и сколько остаётся по-настоящему открытым.

Тариф AI Ultra за 100 $: сброс ценовой планки

Google AI Ultra теперь начинается со 100 $ в месяц, более высокий тариф — 200 $. Предыдущий план Ultra стоил 250 $. Новый начальный уровень включает доступ к бете Gemini Spark, в 5 раз больший лимит использования приложения Gemini по сравнению с тарифом Pro за 20 $, 20 ТБ облачного хранилища и YouTube Premium.

Стратегическое прочтение прямое: Google агрессивно ценит премиальный потребительский AI, чтобы захватить ранних адоптеров, которые определят, как ощущается агентский продукт. За 100 $/месяц Spark теперь напрямую конкурирует с верхней частью тарифов ChatGPT Pro и потребительских планов Claude. Агентская функция — дифференциатор, и это функция, версии которой конкурентам придётся выпустить в ближайшие 12 месяцев, или уступить категорию агентов продуктивности.

Для креаторов и операторов релевантный вопрос: ускоряет ли 100 $/месяц за персонального агента работу значимо. Честный ранний ответ: всё зависит от того, оправдает ли бета Spark ожидания демо. Демо есть демо. Узнаем через 90 дней.

Android XR и Project Aura: аппаратная поверхность

Google также представил новые устройства «интеллектуальных очков», включая Project Aura, умные очки XR-класса, разработанные в партнёрстве с Xreal. В этом году запускаются как минимум три партнёрства по умным очкам, позиционируя Google между аудио-приоритетными Ray-Bans от Meta и полноценными XR-гарнитурами.

AI-угол: они работают на Gemini. Живой визуальный контекст, голосовое взаимодействие и агентское действие — всё носимое. Для AI-видео последствия ниже по течению, но реальные. Носимая камера с контекстом Gemini становится постоянным устройством ввода для создания видео, как для захвата референсов, так и для живой правки на ходу. До того, как это станет важно для производственных рабочих процессов — 18 месяцев. До того, как это станет важно для потребительских демо — ноль месяцев.

Android 17: ОС как слой интеллекта

Обновление Android от Самира Самата позиционировало саму ОС как преобразование «из операционной системы в систему интеллекта». Фрейминг — Gemini понимает контекст между приложениями, предвидит потребности и совершает действия от имени пользователя — это тот же тезис слоя агентов, применённый к мобильной платформе.

Конкретные функции значат меньше, чем фрейминг. Google привержен будущему, в котором слой ОС и слой агентов сворачиваются в единый стек, всё работает на базовых моделях Gemini. Для разработчиков это означает, что дизайн приложений с учётом агентов больше не опциональный паттерн; это базовое допущение, вокруг которого Google строит платформу.

Что не вышло: отсутствие Veo 4

Самый ожидаемый анонс, который не состоялся: Veo 4. Не было ни презентации Veo 4, ни сроков Veo 4, ни явного подтверждения, что Veo отказывается от использования в пользу линии Omni.

Наиболее вероятное прочтение: Google консолидирует усилия по генеративному видео под Omni, а не продолжает параллельную разработку Veo. Omni Flash позиционируется как новая точка старта. Veo 3.1 остаётся вариантом производственного класса для случаев использования, которые Omni Flash пока не покрывает — особенно более длинная одноплановая генерация, вывод 4K и согласованность персонажа через ID-embedding, ни одна из которых пока не поддерживается Omni Flash.

Для более широкой индустрии AI-видео это значимый разворот. Восемнадцать месяцев разговоров «что сделает Veo дальше» сменились на «что такое Omni». Операторам с автоматизацией под Veo придётся оценить, ждать ли созревания Omni для длинного формата или поддерживать производство на Veo 3.1 в обозримом будущем. Вероятно — и то, и другое, параллельно, для разных типов контента.

Что это значит для операторов AI-видео

Шагнув назад от отдельных анонсов, вчера изменились три вещи, которые сформируют AI-видео на следующий год.

Во-первых, модельная стратегия стала запутаннее — и это полезно. Omni — это ставка на объединённую мультимодальность, но Omni Flash только короткого формата. Veo 3.1 по-прежнему выполняет тяжёлую работу для более длинных клипов и более высоких разрешений. Настоящие производственные конвейеры будут использовать оба, маршрутизировать между ними и динамически переключаться по мере созревания Omni. Эта логика маршрутизации живёт в слое агентов.

Во-вторых, мышление в категориях слоя агентов теперь консенсус. Spark — это Google, вслух говорящий, что фрейминг чат-бота был переходным шагом, а место назначения — автономный агент. Каждая потребительская и корпоративная команда AI-продукта, спорившая, строить ли «ассистента» или «агента», получила окончательный ответ. Слой агентов — туда смещается конкуренция.

В-третьих, разговорное редактирование меняет рабочие процессы креаторов. Акцент Omni на редактировании в чате — уточнение клипа путём описания того, что изменить — сворачивает прежний двухэтапный процесс «сгенерировать-потом-отредактировать». Для AI-видео-креаторов это значимое упрощение UX, которое от конкурентов ожидают повторить. Конвейер Genra уже поддерживает разговорную итерацию; ожидайте, что каждая серьёзная AI-видео-платформа выпустит свою версию этого в течение шести месяцев.

Что Genra делает дальше

Несколько честных замет о том, куда Genra движется отсюда.

Omni Flash будет интегрирован, как только станет доступен через Gemini API. Слой агентов, который строит Genra, был спроектирован модельно-независимым именно для того, чтобы добавления вроде Omni становились изменениями бэкенда, а не рабочего процесса. Пользователи увидят более качественный вывод короткого формата, когда логика маршрутизации начнёт выбирать Omni Flash для кадров, в которых он лучше всего. Длинный формат, 4K и случаи высокой согласованности продолжают работать на Veo и Seedance.

Фрейминг Spark как агента, постоянно работающего в облаке 24/7, — самая близкая валидация тезиса о слое агентов, которую мы могли бы попросить. Genra — доменно-специфичный агент для производства видео. Spark — общего назначения агент для личной продуктивности. Они комфортно сосуществуют — так же, как CRM-агент и кодирующий агент сосуществуют с общим помощником продуктивности.

Более крупная конкурентная рамка: теперь, когда Google привержен слою агентов на уровне платформы, вопрос для каждого AI-видео-стартапа больше не «будут ли агенты будущим» — это решено. Вопрос: какие доменно-специфичные агенты станут доверенным выбором в своей категории. Для AI-видео это вопрос, на который Genra построена отвечать.

Ключевые выводы

Google I/O 2026 не выпустил Veo 4. Главным видео-анонсом стал Gemini Omni — объединённая мультимодальная модель, обрабатывающая генерацию текста, изображения, аудио и видео в единой системе, с Omni Flash в качестве первой публичной модели.
Gemini Spark — постоянно работающий в облаке 24/7 персональный агент, действующий через продукты Google и сторонние сервисы, подключённые по MCP, — стратегически наиболее значимый анонс. Он привязывает Google к слою агентов как к следующему платформенному сражению.
Gemini 3.5 Flash вышел вчера; Gemini 3.5 Pro в тестировании на следующий месяц. Каждое обновление основы было оформлено вокруг агентских возможностей, а не просто интеллекта.
AI Ultra переценён на 100 $/месяц на входе (200 $ верхний тариф), снижен с прежних 250 $ Ultra. Доступ к бете Spark в США ограничен тарифом за 100 $ начиная со следующей недели.
Antigravity 2.0 расширяет платформу разработки агентов Google инструментами оркестрации — инфраструктурный ход для разработчиков агентов.
Android XR и умные очки Project Aura, плюс фрейминг «система интеллекта» Android 17, распространяют тезис об агентах на слои железа и ОС.
Omni Flash только короткого формата. Veo 3.1 остаётся производственным инструментом для более длинного, более высокого разрешения, ID-согласованного видео. Настоящие конвейеры будут маршрутизировать между обоими.
Разговорное редактирование как первоклассная возможность в Omni — это сдвиг рабочего процесса, который конкурентам нужно будет повторить за шесть месяцев.
Genra интегрирует Omni Flash, как только станет доступен API, при этом пользователи увидят прирост качества на маршрутизированных коротких кадрах незаметно. Длинный формат, 4K и работы, критичные к согласованности, продолжают идти на Veo и Seedance.

Часто задаваемые вопросы

Объявил ли Google Veo 4 на I/O 2026?

Нет. Анонса Veo 4 не было. Вместо этого Google представил серию моделей Gemini Omni, и Omni Flash — первая публично доступная модель. Наиболее вероятная интерпретация: Google консолидирует работу по генеративному видео под фреймворком Omni, а не продолжает параллельные поколения Veo.

Что такое Gemini Omni?

Gemini Omni — новая объединённая мультимодальная серия моделей Google, способная нативно генерировать текст, изображение, аудио и видео из объединённых входов. Omni Flash — первая публичная модель, ориентированная на короткое видео с синхронизированным нативным аудио и разговорным редактированием.

Что такое Gemini Spark?

Gemini Spark — постоянно работающий в облаке 24/7 персональный AI-агент, который запускается на выделенной VM Google, интегрируется с продуктами Google и 30+ сторонними сервисами через MCP, и совершает действия от имени пользователя — бронирует, заказывает, набрасывает и управляет задачами. Бета выходит подписчикам AI Ultra в США на следующей неделе.

Сколько стоит Google AI Ultra в 2026 году?

Новый стартовый тариф AI Ultra — 100 $ в месяц, снижен с 250 $. Более высокий тариф — 200 $. План за 100 $ включает доступ к бете Gemini Spark, в 5 раз больший лимит использования приложения Gemini, чем у тарифа Pro, 20 ТБ облачного хранилища и YouTube Premium.

Что такое Gemini 3.5 Flash?

Gemini 3.5 Flash — последняя базовая модель Google быстрого уровня, выпущенная 19 мая 2026 года. Google утверждает, что она превосходит Gemini 3.1 Pro в бенчмарках по программированию, агентским и мультимодальным задачам, работая примерно в 4 раза быстрее по скорости вывода сопоставимых фронтирных моделей. Доступна в приложении Gemini, Search, Antigravity и Gemini API.

Что такое Antigravity 2.0?

Antigravity — платформа разработки агентов Google. Релиз 2.0 добавляет инструменты оркестрации, позволяющие разработчикам собирать, планировать и контролировать несколько взаимодействующих агентов. Он нацелен на инфраструктурный слой под агентскими продуктами.

Что Google объявил об умных очках на I/O 2026?

Google представил новые устройства «интеллектуальных очков» класса Android XR, включая Project Aura, разработанный с Xreal. Как минимум три партнёрства по умным очкам запускаются осенью 2026 года, позиционируя Google между аудио-приоритетными очками и полноценными XR-гарнитурами. Все работают на Gemini.

Будет ли Genra интегрировать Gemini Omni?

Да. Genra построена так, чтобы интеграция новой модели была изменением бэкенда, а не изменением рабочего процесса. Omni Flash будет добавлен в логику маршрутизации агента, как только он станет доступен через Gemini API. Пользователи увидят улучшения качества на выходе короткого формата без изменения способа работы.

Доступен ли Veo 3.1 после I/O 2026?

Да. Veo 3.1 остаётся доступным через Google AI Studio и Vertex AI. Он продолжает оставаться вариантом производственного класса для более длинных клипов, вывода 4K и случаев использования, которым нужна согласованность персонажа через ID-embedding — возможностей, которые Omni Flash пока не поддерживает.

Что I/O 2026 значит для AI-видео-креаторов?

Три сдвига. Во-первых, модельная стратегия теперь охватывает Omni для коротких объединённых мультимодальных задач и Veo 3.1 для длинного формата и высокого разрешения — настоящие конвейеры будут маршрутизировать между обоими. Во-вторых, мышление в категориях слоя агентов теперь консенсус на уровне платформы, а не только ставка стартапа на позиционирование. В-третьих, разговорное редактирование становится базовой возможностью, которой все AI-видео-инструменты должны будут соответствовать.

Об авторе
Крис Шерман освещает технологии AI-видео, агентские архитектуры и бизнес креативного производства. Подпишитесь на @GenraAI для продолжающегося освещения ландшафта AI-видео после I/O и слушаний по MiniMax (29 мая).