Шесть сдвигов, которые уже произошли: AI-видео по итогам середины 2026
· Genra AIНе прогнозы. Инвентаризация. Шесть вещей, которые уже стали тем, как работает индустрия.
Поле реорганизовалось, пока вы смотрели на модели
Если бы вы уснули на Новый год и проснулись на этой неделе, версия AI-видео по состоянию на декабрь 2025-го была бы неузнаваема. Логотип Sora 2 исчез со страницы продукта OpenAI. Самая упоминаемая модель на Artificial Analysis Video Arena — та, которой восемь недель назад не существовало и которую анонимно запустила незнакомая вам команда. Доминирующий вопрос на форумах авторов уже не «какая модель лучшая?». А «какого агента запускать?». Согласованность персонажей — узкое место всякого длинного AI-проекта последние два года — перестала быть фичей, которую кто-то хотя бы упоминает в маркетинге. AI-документалка на 10 минут, бывшая в начале года демо лунного уровня, сегодня — то, что одиночный автор отгружает за рабочую неделю.
Пять месяцев. Шесть сдвигов. Ни один не прогноз. Это инвентаризация: вещи, которые к маю 2026-го уже стали тем, как индустрия фактически работает. Ниже — что было каждым, что изменилось, конкретные события и цифры за ними и что это значит для того, что вы строите дальше.
Сдвиг 1 — Крах Sora 2 переорганизовал верхушку поля
У главного события года на сегодня есть даты: 31 декабря 2025 (запуск Sora 2), 10 января 2026 (бесплатный тариф приостановлен после десяти дней), 24 марта 2026 (объявление о закрытии), 26 апреля 2026 (закрытие потребительского приложения и веб-интерфейса), 24 сентября 2026 (прекращение API). Восемьдесят четыре дня в качестве потребительского продукта. Самый разрекламированный запуск в истории AI-видео отгрузился, достиг пика и сложился внутри одного финансового квартала.
Заголовочные цифры стоит увидеть в одном месте, потому что они объясняют, почему крах был столь быстрым и почему он утянул за собой так много капитала и доверия:
| Метрика | Sora 2 | Индустриальный бенчмарк |
|---|---|---|
| Пиковая суточная стоимость инференса | ~$15 млн | На порядок ниже при сравнимом объёме |
| Совокупная выручка, относимая на Sora | ~$2,1 млн | — |
| Соотношение затраты/выручка | ~600:1 | <5:1 для устойчивых AI-инструментов |
| Доступ к 1080p | $200/мес (только Pro) | $5–30/мес (Kling, Runway, Seedance) |
| Разрешение стандартного тарифа | 480p | 720p–1080p |
| Длительность бесплатного тарифа | 10 дней, затем убран | Постоянный (ограниченный) |
Ущерб с Disney усугубил финансовый ущерб. OpenAI и Disney подписали IP-сделку примерно на $1 млрд, охватывавшую более 200 персонажей из Disney Animation, Marvel, Pixar и Star Wars — крупнейший ров, который когда-либо выстраивал какой-либо AI-видео-продукт. По сообщениям, Disney была уведомлена менее чем за час до публичного объявления. Сделка обвалилась. Три топ-менеджера OpenAI, связанных с потребительским направлением Sora, ушли в последующие недели. (Полный пост-мортем — в нашем разборе, почему OpenAI убила Sora.)
Эффект ниже по течению оказался не тем, что предсказывали наблюдатели. Пользователи Sora 2 не мигрировали в одного преемника. Они разошлись, предсказуемо, по задачам: тяжёлая физика — в Veo 3.1, вставки персонажа cameo-стиля — в Kling 3, длинные сторибордовые сцены — в Seedance 2, фотореалистичная работа с людьми — в Luma Ray3 (миграционный отчёт фиксирует распределение в «куда ушли пользователи Sora»). Рамка «одна модель, чтобы править всеми» рухнула вместе с Sora 2; её не восстановили.
Что это изменило. Турнирная таблица теперь зависит от задачи. Нет ответа в стиле Q1 «топ-модель» для мая 2026-го. Правильный вопрос — какая модель подходит под снимаемый план, а отвечает на него всё чаще агент, а не автор. Эпоха, когда единственная героическая модель могла якорем держать стек автора, закончилась и едва ли вернётся — экономика, убившая Sora 2 ($600 компьюта на каждый $1 выручки), не уникальна для OpenAI; она применима ко всякому, кто пытается быть доминирующим единичным провайдером модели.
Сдвиг 2 — Новая вершина рейтинга, построенная в Китае
Обратная сторона ухода Sora 2 — китайские модели не просто заполнили пустоту, они взяли верх. Самая яркая иллюстрация — HappyHorse 1.0, самый значимый запуск модели в 2026-м к настоящему моменту.
7 апреля 2026 на лидерборде Artificial Analysis Video Arena появилась безымянная модель. Ни пресс-релиза, ни логотипа команды, ни публичных весов. За 48 часов она вышла на №1 в Text-to-Video с Elo 1389 — на 115 пунктов впереди Seedance 2.0, прошлого лидера, — и №1 в Image-to-Video с Elo 1416. 9–10 апреля X-аккаунт @AthAI_Official раскрыл, что модель создана ATH AI Innovation Unit от Alibaba, под руководством Чжана Ди — бывшего VP в Kuaishou и архитектора Kling AI. Архитектор одного китайского лидера тихо перешёл и построил конкурента у другого китайского гиганта. (Полный технический разбор — в нашем разборе HappyHorse 1.0.)
HappyHorse — заголовок, но не единственная точка данных. Распределение лидеров по дорожкам на середину мая 2026:
| Дорожка | Лидер (май 2026) | Где собрана | Почему |
|---|---|---|---|
| Стилизованное / анимационное / близкое к аниме | Kling 3.0 | Kuaishou (КНР) | Нативные 4K/60fps, самый щедрый бесплатный тариф среди топовых |
| Бренд и продукт, управляемые референсом | Seedance 2.0 | ByteDance (КНР) | Мультимодальная референсная система, дистрибуция через CapCut на ~500M+ пользователей |
| Короткая драма на китайском и CN-коммерс | HappyHorse 1.0 | Alibaba (КНР) | Нативная мандаринская липсинхронизация, самая низкая API-цена в топе |
| Диалогоёмкое, broadcast-grade | Veo 3.1 | Google (США) | Нативное аудио 48 kHz, профессиональная color science, Extend |
| Фотореалистичный человек / talking head | Luma Ray3 | Luma (США) | Текстура кожи, поведение глаз, микроэкспрессии |
| Локально / on-prem / NDA-работа | LTX-2 | Lightricks (Израиль) | Первая модель из топа, надёжно работающая на одном топовом потребительском GPU |
Три из шести лидеров — китайские. Восемнадцать месяцев назад этой конфигурации не существовало. Паттерн не националистический — это устойчивый поток талантов и капитала: мобильность архитекторов в духе Чжана Ди между Kuaishou, ByteDance и Alibaba стала обычным делом, а одна только дистрибуция CapCut от ByteDance — ров, который не может перепрыгнуть ни один западный AI-видео-стартап.
Что это изменило. Слой модели больше не западный по умолчанию. Инди-авторы, агентства и студии, собирающие продакшен-стек в 2026-м, обязаны оценивать китайские модели на равных с американскими — не как чек на разнообразие, а как требование к возможностям и цене. Команды, выучившие это в Q1, уже имеют значимое преимущество в стоимости и в доступе к возможностям (мандаринский липсинк, стилизация в духе аниме, генерации дешевле $0,50), которых западные модели попросту не дают.
Сдвиг 3 — Слой модели стал коммодити
Спутник Сдвига 2 — разрыв между «лучшим» и «достаточно хорошим» обвалился. К маю 2026-го шесть топ-моделей AI-видео выдают сопоставимый поклиповый аутпут для большинства задач. Разрыв Elo между №1 и №6 в Arena помещается в коридор, который два года назад отделял frontier-модели от догоняющих. Реальные специализации остаются — таблица дорожек выше их перечисляет, — но разрывы сжались до дорожек, а не до абсолютов.
Ценовые данные рассказывают ту же историю с другого ракурса. Стоимость генерации клипа 5 с в 1080p у ведущих моделей в мае 2026-го:
| Модель | Стоимость за генерацию (5 с, 1080p) | Стартовый план |
|---|---|---|
| Kling 3.0 | ~$0,20–0,30 | $5/мес |
| HappyHorse 1.0 | ~$0,25 | Только API, самая низкая цена в топе |
| Seedance 2.0 | ~$0,40–0,60 | Включено в платные тарифы CapCut |
| Veo 3.1 | ~$0,60–0,80 | Привязано к биллингу Vertex AI / Google AI Studio |
| Luma Ray3 | ~$0,80–1,20 | $10/мес стартовый, премиум за реализм людей |
| Sora 2 (выведена) | ~$4–8 | $200/мес Pro за 1080p |
Строка Sora 2 оставлена намеренно. Разрыв в 10–20× между Sora 2 и остальным полем не был особенностью качества OpenAI — это была особенность архитектурных решений, не выживающих коммерчески. Без Sora 2 выживший коридор узкий, и цены сходятся. Команда с фиксированным месячным бюджетом теперь производит примерно тот же объём сравнимого качества вне зависимости от того, какую топ-модель она выбирает.
Это год, когда сходимость возможностей перестала быть прогнозом и стала наблюдением. Клип, сгенерированный Veo 3.1 и Kling 3 из одного и того же промпта, теперь различим по стилистическим предпочтениям, а не по качеству.
Что это изменило. Ценность сместилась наверх. Если у всех есть доступ к сопоставимым генераторам по сходящимся ценам, дифференциатором становится то, как вы их оркеструете — какой кадр маршрутизируется в какую модель, как удерживается идентичность между ними, как планируется аудиоарка, как исчезают швы при сборке. Этот оркестровый слой — следующий сдвиг и крупнейший из них.
Сдвиг 4 — Prompt engineering умер, слой агента взял управление
«Prompt engineering» был в каждой вакансии 2024-го и заметной компетенцией в большинстве AI-резюме 2025-го. К маю 2026-го звучит анахронично — как «HTML-разработчик» в резюме 2020-го. Описанная им компетенция была настоящей, но позиция переехала.
Замена — агент. В 2026-м автор описывает намерение простым языком видео-агенту. Агент разбивает бриф на биты, маршрутизирует каждый бит к наиболее подходящей нижележащей модели из таблицы дорожек, генерирует зафиксированные референсы персонажей и переиспользует их во всех кадрах, планирует закадр и музыку как единые непрерывные дуги (а не по секциям), собирает результат и экспортирует под целевую платформу. Автор остаётся на уровне творческого руководства; агент отрабатывает выполнение. Воркфлоу «напиши идеальный промпт», определивший 2023–2025, отправлен в отставку каждой серьёзно относящейся к объёму командой.
Структурная причина проста: с шестью коммодити-моделями в разных дорожках (Сдвиг 3) человеческие промпты не выдерживают конкуренции с агентом, знающим, какая модель тянет диалоги vs. стилизацию vs. кадры с тяжёлыми референсами, и маршрутизирующим соответственно. Когнитивная нагрузка этим маршрутом вручную на 60+ генерациях для 10-минутного куска — и есть то, что убило многоинструментальный воркфлоу. (Инженерные специфики — в нашем полевом гайде по длинному AI-видео, где раскрывается, какие именно проблемы агентский слой поглощает, а промпты — нет.)
Сигнал рынка труда конкретен. Вакансии «prompt engineer» достигли пика в середине 2024-го и снижаются с Q4 2025. Вакансии «AI workflow operator», «AI production lead» и «AI agent operator» — роли, прямо описывающие операционку уровня агента, — за тот же период росли быстро. Центр тяжести компетенции перемещается от хитрых формулировок к оркестрации систем.
Что это изменило. Скорость и качество продакшена прыгнули вместе и на одной оси — оркестрации. Авторы, делающие самое смотримое AI-видео к середине 2026-го, не обязательно лучшие промпт-писатели — они те, кто использует лучшего агента. Команды, нанимающие в середине 2026-го за промпт-навык, нанимают на позицию, которой больше нет в объёме, который предполагали их предшественники.
Сдвиг 5 — Согласованность персонажа перестала быть узким местом
В 2024-м и большую часть 2025-го одна жалоба ломала длинные AI-проекты: «не могу удержать лицо персонажа согласованным между кадрами». У явления было имя в авторских кругах — «дрифт» — и народный закон: к третьей минуте ваш протагонист — другой человек. Документалки спотыкались об это. Вертикальные драмы спотыкались об это. Вся длинная категория была заперта этим.
К маю 2026-го дрифт перестал быть жалобой. Персистентность идентичности — между эпизодами, между съёмочными днями, между границами моделей — стала базовой нормой для любой агентской пайплайн. Один зафиксированный референс используется в 80 эпизодах вертикальной драмы, 60 генерациях документалки или нескольких месяцах бренд-кампании без заметной деградации.
Технический механизм, решивший это, лежит не в одной модели. Лаборатории моделей выиграли (можно было перестать пытаться удерживать персистентность внутри 8-секундной генерации), но разрыв закрыл агентский слой над моделями. Агент держит токен идентичности, переносит его между генерациями, переключает нижележащие модели не теряя токен, и переперепроверяет результат на дрифт на каждом выходе. Это работает независимо от того, что внизу — Veo, Seedance, Kling или HappyHorse.
Что теперь возможно:
| Формат | До 2026 | Середина 2026 |
|---|---|---|
| 80-серийная вертикальная драма | $150K–$300K live-action; AI-попытки видимо ломаются к 10-й серии | Соло-команда, ~6 недель, низкие пятизначные, идентичность держится на всех 80 |
| 10-минутная документалка | Только с архивом + интервью как якорь | Один автор, 3–5 рабочих дней, идентичность сохраняется на 60+ генерациях |
| Многонедельная бренд-кампания | Требовала совместимых live-action съёмок для удержания персонажа | Агент держит брендированного AI-персонажа на протяжении недель генерации |
Что это изменило. Длинный формат стал жизнеспособным. Без персистентности персонажа AI-видео структурно было коротким медиумом — 60-секундные клипы и изолированные сцены. С ней вся длинная категория открылась инди-командам. Большая часть сдвига стоимости продакшена в Сдвиге 6 — следствие именно этой технической разблокировки.
Сдвиг 6 — Стоимость продакшена рухнула на порядок
Цифры по вертикальной драме публичны и драматичны, поэтому их чаще всего цитируют: бюджеты live-action продакшена $150K–$300K на серию заменены AI-пайплайнами, попадающими в низкие пятизначные для эквивалентного хронометража 70–100 эпизодов. Тот же сдвиг, менее громко, действует для эксплейнера, бренд-ролика, talking head и анимационной короткометражки. Статья затрат, которая раньше доминировала во всех видео-бюджетах, теперь работает в однозначных процентах общего проектного расхода в AI-пайплайнах.
Если перевести сдвиг в цифры по форматам:
| Формат | Бюджет live-action 2024 | Бюджет AI-пайплайна 2026 | Снижение |
|---|---|---|---|
| 80-серийная вертикальная драма | $150K–$300K | $10K–$25K | ~10–15× |
| 10-минутный эксплейнер | $8K–$30K | $300–$1 500 | ~20× |
| 30-секундный бренд-ролик | $30K–$200K+ | $1K–$5K | ~20–40× |
| 5-минутная анимационная короткометражка | $20K–$80K (анимационная студия) | $500–$2 500 | ~30× |
Важная оговорка, без которой обвал затрат не складывается в историю creator economy: стоимость платного привлечения не упала. CPM рекламы Meta и TikTok практически плоские год к году. Связующее ограничение, найдёт ли AI-видео аудиторию, по-прежнему — рекламные траты под него, которые для вертикальной драмы остаются в диапазоне $200K–$1M, чтобы поймать хит. Производственная линия упала в 10–40 раз; дистрибутивная не упала. (Как именно это раскладывается для инди-команд, пробующих модель ReelShort/DramaBox, мы разобрали в плейбуке ReelShort.)
Математика хит-рейта изменилась соответствующе. В 2024-м инди-команде требовалось около $2M оборотного капитала, чтобы запустить одну live-action вертикальную драму с реалистичными шансами на выживание (одна попытка продакшена за $150K + платное привлечение; единичный провал был структурно фатальным). В 2026-м та же инди-команда может выгружать 8–12 попыток в год при сопоставимом бюджете, потому что каждая попытка стоит в ~10–15 раз меньше. Хит-ориентированные категории вознаграждают количество попыток. Математика того, кто может играть в эту игру, изменилась — тихо, но полностью.
Что это изменило. Экономика того, кто может попробовать сделать продакшен, переорганизовалась. Инди-команды, которые не могли позволить себе одной live-action попытки, теперь могут вести портфель попыток. Студии, выигрывавшие за счёт старого рва фиксированных затрат, его потеряли. Концентрация капитала в верхней части индустрии (модель, работавшая для стриминга 2010-х) сменяется фрагментацией капитала по краю.
Что эти шесть сдвигов в сумме
Прочитанные вместе, это не шесть независимых историй. Это одна история, рассказанная с шести углов: центр тяжести в AI-видео сместился с модели на оркестровый слой над ней. Порядок операций каузален:
- Sora 2 рухнула (Сдвиг 1) — убрала с поля яснейший тезис «одна модель, чтобы править всеми».
- Китайские модели заняли верхние дорожки (Сдвиг 2) — заменили однолидерную модель многополюсной.
- Слой модели стал коммодити (Сдвиг 3) — задвинул разрыв «лучшее» vs «достаточно хорошее» в коридор, не разделяющий аутпут авторов.
- Prompt engineering умер, агентский слой поднялся (Сдвиг 4) — потому что при многополюсном слое моделей ни один человек не маршрутизирует между моделями быстрее агента.
- Согласованность персонажа перестала быть узким местом (Сдвиг 5) — потому что агентский слой, держащий токены идентичности между моделями, решил то, чего не решала ни одна отдельная модель.
- Стоимость продакшена рухнула на порядок (Сдвиг 6) — потому что дешёвые коммодити-модели плюс работающий агент дают такую структуру стоимости по минуте, какой не может предложить ни один live-action воркфлоу.
Если вы строите творческую команду в 2026-м, практический вывод в том, что «у нас есть доступ к Veo, Kling и Seedance» — это уже не значимое утверждение о возможностях. Доступ есть у всех. То, что отделяет команду, отгружающую 10 годных видео в месяц, от команды с одним, — агентская инфраструктура между брифами и моделями.
Что это значит для остатка 2026-го
Из этих шести сдвигов следуют три переориентации. Каждая заменяет то, что работало в 2025-м и перестало в какой-то точке первого полугодия 2026-го.
1. Перестаньте ранжировать модели, начните их маршрутизировать
Если ваша команда ещё гоняет внутренние оценки, чтобы выбрать «лучшую модель» для стека, вы тратите энергию, которую 2025-й бы вознаградил, а 2026-й перестал. Лидерборд Arena информативен, но реальный вопрос — какая комбинация моделей, маршрутизированная агентом, ложится на ваши продакшен-потребности по диалогам, референсам, стилизации и языку. Многомодельный агентский стек сейчас бьёт одномодельный по стоимости, скорости и качеству одновременно. Не осталось аргументов в пользу подхода «стандартизируемся на Veo» или «стандартизируемся на Kling», работавшего 12 месяцев назад.
2. Нанимайте за творческое руководство, а не за промпт-навык
Узкое место на аутпуте уже не «может ли кто-то написать хороший промпт». Оно — «есть ли у кого-то ясное видение, что делать». Prompt engineering как сигнал найма — опережающий индикатор того, что команда решает не ту задачу. Повышайте за творческое суждение, вкус и редакторскую дисциплину. Учите оперированию агентом — быстрее в освоении и привязано к платформе, на которой вы остановитесь.
3. Планируйте продакшен в портфельном масштабе
Коллапс затрат означает, что вы можете пробовать многое и убивать большую часть. Команды, выигрывающие остаток 2026-го, — те, кто отгружает 8–12 попыток в год и учится на данных, а не те, кто ставит квартальный бюджет на единый флагман. Хит-ориентированные категории — вертикальная драма, social commerce, брендированный контент — вознаграждают количество попыток. Соответственно: разделяйте «стоимость продакшена за попытку» и «расход на платное привлечение за победителя», и перестаньте смешивать их в одной строке бюджета.
Вывод
Первые пять месяцев 2026-го не подарили одной большой сенсации. Они подарили шесть структурных сдвигов, которые в сумме сдвинули индустрию с её фундамента 2025-го. Слой модели больше не продукт. Слой агента — да. Крах Sora 2 и анонимный взлёт HappyHorse 1.0 на №1 за 48 часов — не отдельные истории, это одна история, рассказанная сначала со стороны провала, потом со стороны успеха. Модель, которая побеждает, — не лучшая модель. Это модель, которая лучшая внутри агента, знающего, какую модель выбирать.
Если ваш AI-видео стек всё ещё считает выбор модели центральным решением, вы играете в рынке 2026-го по плейбуку 2025-го. Это лечится. Большинство команд, которые возьмут вторую половину года, делают это лечение в текущем квартале.
Часто задаваемые вопросы
Какое самое крупное событие AI-видео в первой половине 2026-го?
Закрытие Sora 2, объявленное 24 марта и вступившее в силу 26 апреля. Продукт продержался 84 дня как потребительское предложение и сжёг себя в соотношении затрат-выручки около 600:1 (~$15M/день инференса против ~$2,1M совокупной выручки), утянув запланированную $1B IP-сделку с Disney. Эффект ниже по течению — сходимость возможностей и смещение ценности на агентский слой — это и есть структурное изменение.
Китайские AI-видео-модели действительно на вершине в 2026-м?
Да, и не как обобщение. Конкретно: Kling 3.0 (Kuaishou) лидирует в стилизованном и анимационном; Seedance 2.0 (ByteDance) лидирует в бренд-видео по референсу и дистрибуирована через CapCut на ~500M+ пользователей; HappyHorse 1.0 (ATH AI Innovation Unit от Alibaba, руководитель Чжан Ди) лидирует в короткой драме на китайском и взяла вершину Arena за 48 часов с момента анонимного запуска 7 апреля. Три из шести топ-моделей промышленного уровня в мировом использовании теперь делаются в Китае.
Полезен ли prompt engineering как навык в середине 2026-го?
Для производства готового видео — нет, агенты в значительной степени поглотили эту работу, а вакансии «prompt engineer» снижаются с Q4 2025. Для исследований, оценок и крайних случаев навык всё ещё имеет значение. Но это уже не узкое место продакшен-выпуска.
На сколько AI-видео дешевле live-action в 2026-м?
Примерно в 10–40 раз в зависимости от формата. 80-серийная вертикальная драма упала с $150K–$300K до $10K–$25K. 30-секундный бренд-ролик — с $30K–$200K до $1K–$5K. Стоимость платного привлечения не упала.
На чём AI-видео-команда должна сосредоточиться прямо сейчас?
Строить или принимать единый агентский слой, который ведёт маршрутизацию между моделями, персистентность идентичности персонажа, планирование аудиоарка и сборку. Слой модели — коммодити; дифференциация живёт на уровне выше.
Вернётся ли слой модели на роль дифференциатора?
На текущей траектории — едва ли. Экономика компьюта, убившая Sora 2, действует на каждого, кто пытается быть доминирующим единичным провайдером. Специализация внутри дорожек продолжится, но эра, когда одна модель могла якорем держать целый стек, закончилась.
Об авторе
Chris Sherman пишет о технологиях AI-видео и творческих производственных процессах. Ещё больше гайдов по производству AI-видео — @GenraAI.