Runway Gen-4.5 深度评测:它是如何击败 Sora 2 和 Veo 3 的?

· Chris Sherman

从"Whisper Thunder"到排行榜第一:Gen-4.5 的崛起

当一个名为"Whisper Thunder"的神秘模型悄悄爬上 Artificial Analysis 视频竞技场排行榜榜首时,整个 AI 视频圈都在猜测它的真实身份。2025年12月1日,谜底揭晓:它就是 Runway Gen-4.5,而且它刚刚击败了 Google Veo 3 和 OpenAI Sora 2。

凭借 1,247 Elo 分,Gen-4.5 目前是所有 AI 视频生成模型中排名最高的。但原始的 benchmark 数字只是故事的一部分。这个模型到底有什么不同,你是否应该切换到它?

在这份完整指南中,我们将深度解析 Gen-4.5 击败竞争对手的原因、如何有效使用它,以及它是否值得你在创作工作流中投入。

当前 AI 视频模型排名(2026年1月)

在深入了解功能之前,先看看 Gen-4.5 在 Artificial Analysis benchmark 上的排名:

排名 模型 Elo 分数 核心优势
#1 Runway Gen-4.5 1,247 物理准确性、提示词遵循度
#2 Google Veo 3 1,226 原生音频、电影级画质
#3 Kling AI 2.6 1,218 人物真实性、唇形同步
#7 OpenAI Sora 2 Pro 1,206 叙事连贯性、更长片段

这个 benchmark 重点评估的是提示词遵循度运动质量,而不仅仅是分辨率或帧率。通过在这些定性指标上的出色表现,Runway 拿下了榜首位置。

Gen-4.5 击败 Sora 2 和 Veo 3 的三大原因

Gen-4.5 的胜利归结于三个根本性改进,这些改进直击 AI 视频生成的最大痛点:

1. 终于有"正常"的物理效果了

早期的 AI 视频模型经常产出"魔幻物理"——物体不自然地漂浮、液体像果冻一样流动、布料像在水下一样飘动。Gen-4.5 彻底改变了这一点。

有什么不同:

  • 物体现在具有真实的重量、惯性和动量
  • 液体能够自然地倾倒、飞溅和汇聚
  • 布料按照材质特性垂坠和飘动
  • 碰撞和交互遵循可信的物理规则

Runway 将其描述为"物体具有真实的重量和动量"——在实际测试中确实如此。一杯水被倒出来,看起来真的像水,而不是数字糖浆。

2. 你的提示词终于管用了

AI 视频生成中最令人沮丧的问题之一就是:你想要的和你得到的之间存在巨大鸿沟。Gen-4.5 显著缩小了这个差距。

你现在可以写详细的相机指令,比如:

"从左向右跟拍,带有轻微手持晃动,推近到角色面部特写,黄金时段光线带镜头光晕"

而 Gen-4.5 真的会执行这些指令。模型能够理解复杂的顺序指令,包括:

  • 详细的相机编排(推轨、摇臂、跟拍镜头)
  • 场景内事件的精确时间安排
  • 氛围和光线变化
  • 多元素场景构图

3. 视觉细节终于稳定了

以前的模型经常出现"细节漂移"——头发会改变质感,布料图案会变形,表面反射会在帧之间随机闪烁。Gen-4.5 在整个视频中保持一致性。

具体改进包括:

  • 头发保持质感和运动一致性
  • 布料纹理图案保持稳定
  • 表面光泽(光亮度、反射)保持连贯
  • 角色特征不会在镜头中途变形

Gen-4.5 背后的技术

在底层架构上,Gen-4.5 相比之前的模型有重大转变。

自回归到扩散(A2D)架构

Gen-4.5 使用了一种名为自回归到扩散(Autoregressive-to-Diffusion,A2D)的混合方法。它结合了:

  • 自回归模型:擅长理解语言和场景构成
  • 扩散模型:擅长生成高保真度的视觉细节

结果是一个能够真正理解你在要求什么(得益于自回归组件)并且能够漂亮地渲染出来(得益于扩散模型)的模型。

NVIDIA Blackwell 部署

Gen-4.5 是首批运行在 NVIDIA 新 Blackwell 架构上的生产级 AI 视频模型之一。这不仅仅是营销话术——它带来了:

  • 相比之前的训练周期成本降低 28%
  • 更快的推理速度
  • 更好地处理复杂场景

Runway 还确认,Gen-4.5 仅用一天时间就从 NVIDIA Hopper 迁移到了新的 Vera Rubin NVL72 平台,展示了模型架构的灵活性。

Runway Gen-4.5 使用教程

快速上手

  1. 访问 runwayml.com 并登录
  2. 选择视频创作模式
  3. 从左下角的模型选择器中选择 Gen-4.5
  4. 输入提示词并生成

提示词结构

为获得最佳效果,建议使用以下提示词结构:

[相机运动] shot of [主体/物体] [动作] in [环境]

示例提示词:

基础:

"Tracking shot of a woman walking through a neon-lit Tokyo street at night"

进阶:

"Slow dolly-in shot of an astronaut examining an alien artifact, dramatic side lighting with blue rim light, dust particles floating in zero gravity, 4K cinematic quality, shot on ARRI Alexa"

有效的相机术语

Gen-4.5 理解专业电影摄影术语:

  • 运动:dolly(推轨)、track(跟拍)、pan(摇镜)、tilt(俯仰)、crane(摇臂)、steadicam(稳定器)、handheld(手持)
  • 构图:close-up(特写)、medium shot(中景)、wide shot(全景)、extreme close-up(大特写)
  • 光线:golden hour(黄金时段)、Rembrandt lighting(伦勃朗光)、high-key(高调)、low-key(低调)、rim light(轮廓光)
  • 风格:shot on [相机品牌]、anamorphic(变形宽银幕)、film grain(胶片颗粒)、bokeh(散景)

定价分析:值不值得?

Gen-4.5 采用积分制:

套餐 价格 积分 Gen-4.5 视频时长
Standard $12/月 625 积分 约 25 秒
Pro $28/月 2,250 积分 约 90 秒
Unlimited $76/月 无限 无限

关键计算:Gen-4.5 消耗每秒 25 积分。按 Standard 套餐计算,约 $0.48/秒 生成的视频。

与竞品对比

  • Google Veo 3:$28.99/月(AI Pro)到 $359.98/月(Ultra)
  • OpenAI Sora:$20/月(ChatGPT Plus)有限访问,$200/月(Pro)
  • Kling AI:$7/月起 - 更便宜但功能较少

Runway 处于中间位置——比 Veo 3 Ultra 或 Sora Pro 更易获取,但比预算选项功能更强。

已知局限性(需注意)

尽管排名第一,Gen-4.5 并不完美。以下是当前的局限:

暂不支持音频

与 Veo 3 不同,Gen-4.5 只能生成无声视频。Runway 表示音频支持"即将推出",但目前你需要在后期添加声音。

仅支持文生视频

Gen-4.5 目前只支持文本提示词。图生视频功能(在 Gen-4 中可用)尚未集成。

物理边缘情况

虽然物理效果大幅改善,但模型仍然在以下方面有困难:

  • 因果推理:效果有时先于原因(门先开后按把手)
  • 物体恒存:物体可能意外消失或出现
  • 计数:角色用手指数数时经常跳过数字
  • 成功偏差:动作过度成功(瞄得很差的踢球仍然进球)

Gen-4.5 vs 替代方案:什么时候用什么

使用场景 最佳选择 原因
最高视觉质量 Runway Gen-4.5 排名第一,最佳物理和提示词遵循
需要音频的视频 Google Veo 3 原生音频生成、唇形同步
较长叙事(20秒以上) OpenAI Sora 2 长时间叙事连贯性更好
预算有限的创作者 Kling AI $7/月起步价
完整创意控制 Genra 端到端工作流,含脚本和音乐

最终结论:你应该使用 Gen-4.5 吗?

适合你,如果:

  • 视觉质量是你的首要考量
  • 你需要对相机运动和构图的精确控制
  • 你可以接受在后期添加音频
  • 你想要当前的 benchmark 冠军

考虑其他选择,如果:

  • 你需要原生音频(用 Veo 3)
  • 你在创作较长的叙事内容(用 Sora 2)
  • 你想要含脚本的一站式解决方案(用 Genra)
  • 预算是主要考量(用 Kling AI)

AI 视频的下一步是什么?

Gen-4.5 的成功标志着 AI 视频生成领域评价标准的转变。竞争不再是关于分辨率或时长——而是关于理解物理、遵循指令和保持一致性

随着 Runway 与 NVIDIA 在 Rubin 平台上的合作,以及竞争对手争相追赶,2026 年正在成为 AI 视频真正达到生产级别的一年。

问题不再是 AI 视频是否会取代传统制作——而是哪个工具最能配合你的创意愿景。Gen-4.5 刚刚把标准抬高了一大截。

"Gen-4.5 达到了前所未有的物理和视觉准确度。物理定律可以遵循也可以忽略,取决于你的意愿。" — Runway Research