如何用 AI 制作 SaaS 产品演示视频:一步步实操指南

· Genra AI

大多数 SaaS 产品 demo 视频要花两周时间、开三次会、外加一个做到一半就消失的 freelancer。这篇文章讲一个更现实的方案:用 AI Agent 在一天内交付一支可以直接上线的 demo——包括你真正需要的三种格式、一套永远不过时的 3 段式脚本公式、一份能让 agent 第一遍就出可用画面的 Brief 模板,以及成片到底要嵌在哪几个位置才会带来注册。

SaaS 产品 demo 视频是 B2B 营销里杠杆最高的资产之一。它是把冷流量转成试用的页面,是把停滞的销售机会重新激活的邮件附件,是决定一次付费安装能否发生的应用商店预览。但大多数 B2B 团队一年只能上线一支 demo,原因是制作流程——Brief、脚本、屏录、配音、剪辑、三轮干系人评审——重得让视频跟不上产品。半年后,demo 里展示的还是已经下线的旧 UI。

当制作流程从两周压缩到一天,这件事就变了。本文讲的是我们看到 B2B 团队真正在用的工作流:选格式、写脚本、写 Brief、人工过一遍、发布。最长的步骤是写脚本,其余的事 agent 都能接管。

第一步——选定三种格式之一(不要混着做)

动笔写脚本之前,先决定你要做的是哪种格式。SaaS demo 视频最常见的失败模式,就是想用一支视频同时承担三个任务,最后做出一支 5 分钟谁也看不完的片子。只选一个。

格式 A——30 秒 Hero Demo

放在官网首页顶部。静音自动播放,带字幕。任务:用 30 秒讲清你的产品是什么以及用户用了之后日子有什么变化。不讲功能、不讲价格、不讲创始人故事,只讲用户日常的"前后对比"。Hero demo 决定的是"继续滚动"还是"开始免费试用"。

格式 B——90 秒到 2 分钟功能巡览

放在 /product 或 /features 页面,有时候也作为销售邮件附件。任务:按真实用户会触达的顺序,介绍 3-5 个核心功能。这是大多数团队不假思索就默认选的格式,但其实只有当用户已经大概知道你是做什么的、正在评估具体能力是否匹配时,它才是对的选择。

格式 C——3-5 分钟首次使用 / 用户引导视频

放在产品内部(注册后欢迎页、空状态、帮助中心)和激活邮件序列里。任务:把一个刚注册的新用户从"我刚注册"带到"我完成了第一个有价值的动作"。它影响的是激活率,不是注册率。

如果你完全没有 demo 视频,先做格式 A。它推动的是早期 SaaS 最关键的转化指标。格式 B 和格式 C 排在第二、第三。

第二步——用 3 段式公式写脚本

这是一个能扛住产品迭代、扛住信息升级、扛住所有干系人评审的脚本公式。三幕,按顺序,每一幕有清晰的任务。

第一幕——痛点(占 15-25% 时长)。开场不要讲你的产品,讲用户当下的真实状态:他手动维护的 Excel、淹没他的收件箱、每周一花 40 分钟手搓的 Dashboard。前 5 秒里他必须认出自己的日常,否则就跳出。

第二幕——产品登场(占 50-60% 时长)。你的产品出现,同样的任务,用一小段时间、几步操作就完成。这一段你要展示真实 UI 在做真实的事。关键:不要讲功能,讲结果。"两步连上你的数据源"永远比"基于 OAuth 的连接器库,支持 200+ 集成"更打动人,哪怕第二句话技术上更准确。

第三幕——闭环(占 15-25% 时长)。展示后置状态 + 一个 CTA。周一 dashboard 现在 4 分钟搞定,不再是 40 分钟;收件箱清零;团队在出货。结尾给一个清晰、唯一的 CTA:"开始免费试用" / "预约 demo" / "拿你的数据试一下"。只选一个,永远不要两个。

这套公式三种格式都通用,时长变了,比例不变。格式 A 把第一幕和第三幕各压到 5 秒;格式 C 把第二幕拉成分步走查。结构不变。

第三步——给 AI Agent 写 Brief(直接套这个模板)

Agent 渲染的就是你描述的内容。模糊的 brief 产出模糊的视频。下面这份 brief 在脚本写完之后大约花 20 分钟就能填完,它是 agent 真正在处理的工作单元。

产品背景(3 句话)。产品是什么、谁在用、它替代了什么。例:"Acme 是一款面向 usage-based SaaS 公司的 B2B 计费平台。它服务于 $5M-$50M ARR 公司的财务和 RevOps 团队。它替代的是自己写的计费脚本 + Stripe Billing 拼装方案。" 三句话,不要更多。

目标观众(1 句话)。你想转化的那一个具体的人。例:"一家 Series B SaaS 公司的财务负责人,目前在用 Excel 加 Stripe webhook 胶水代码维护按用量计费。"

格式与时长。"格式 A——30 秒 hero demo,竖屏 9:16 用于社媒,横屏 16:9 用于官网嵌入。"

脚本。把第一/二/三幕完整脚本贴进去,每一幕都加明确的小标题。每一个节拍标注出对应的画外音文案 + 画面动作。

视觉风格。挑三个形容词。例:"干净、技术感、自信。" 然后用一段话展开:"干净 = 大量留白,不要无意义的动效图形。技术感 = 真实产品 UI、真实数据、真实数字——不要假占位数据。自信 = 没有道歉式语言,不出现'我们希望',不软推销。"

品牌素材。Logo 文件、主色 HEX、辅色 HEX、字体名(或字体文件)。如果有出镜主持人的声音 profile 或形象参考,一并附上。

分发渠道。这支视频会落到哪。这告诉 agent 用什么宽高比、用什么字幕风格、前 3 秒要怎么开。官网嵌入和 LinkedIn 广告和产品内激活弹窗——读法是不一样的。

必须包含 / 必须避免。两份短清单。必须包含:具体的 UI 屏幕、具体的话术、具体的 CTA。必须避免:竞品名字、你拿不出来证据的合规声明、创始人喜欢但别人都不喜欢的口头禅。

把这份 brief 存成一个可复用的模板。后续这款产品再做 demo,大部分字段都能复用,只需要替换脚本和渠道。

第四步——生成,然后做一轮人工评审

Agent 跑完整制作链路:脚本到分镜、分镜到音频、音频到剪辑、剪辑到成片导出。一支格式 A 30 秒视频,第一遍生成大约 10-20 分钟。一支格式 C 3-5 分钟引导视频,预计 30-60 分钟。

不要直接用第一遍的版本。发布前做一轮结构化的人工评审。

把视频连看三遍,每一遍只看一个维度:

  • 第 1 遍——信息保真度。第二幕真的展示了脚本里写的那个结果,还是 agent 默认回到了"功能罗列"?第三幕的 CTA 跟渠道匹配吗?看的时候把脚本开在旁边。
  • 第 2 遍——品牌保真度。颜色对吗?Logo 位置对吗?画外音听上去是你品牌的声音吗?画面里的产品 UI 看上去像你的产品吗?
  • 第 3 遍——前 3 秒测试。把声音关掉,只看前 3 秒。目标观众能在这 3 秒里认出自己的日常吗?如果不能,钩子就坏了——回去改第一幕的 brief,重新生成。

如果第 3 遍没过,整段重生成。如果第 1 或第 2 遍只是小问题,改 brief 然后只对受影响的片段做局部重生成,不要重做整支视频。三遍都通过,发布。

第五步——嵌入到 5 个真正带来注册的位置

一支只放在官网首页的 demo 视频,只发挥了它 20% 的作用。同一支视频经过合理剪辑,能在 5 个不同的入口同时拉注册:

  • 官网首页 Hero 区。格式 A,30 秒,静音自动播放、循环、带烧录字幕。首屏内。
  • 产品 / 功能页。格式 B,90 秒到 2 分钟。点击播放,默认开声音。放在 hero 区下方、功能列表上方。
  • 新用户邮件序列。第 1 封欢迎邮件用格式 A,第 2-4 封把格式 C 切成 90 秒一段。邮件正文用动态 GIF 预览跳转到完整视频——邮件内嵌视频在不同邮件客户端表现不稳定。
  • App Store / 插件商店列表。把格式 A 重剪成商店要求的精确规格(App Store:竖屏,最长 30 秒,字幕开)。商店预览那 30 秒是漏斗里杠杆最高的时间段,也是团队最常忽略的位置。
  • 销售素材与外联。格式 B 做成 Loom 风格的素材,AE 直接贴在外联里。同一支视频带字幕嵌进每一份销售 deck 的第二页。用了它的销售代表,约见接受率比没用的高 1.5-2 倍。

把 demo 投到这 5 个位置,它才从一个营销资产变成一个真正的转化杠杆。大多数团队漏掉其中 3 个,然后纳闷"我们的 demo 没动指标"。

常见踩坑(以及怎么避开)

第二幕变成功能罗列。最常见的失败。脚本写"展示我们的集成库",视频就变成 45 秒每个 logo 都过一遍。修法:在 brief 里把每一个功能名词替换成结果动词。"200+ 集成"改成"注册后 5 分钟你的数据就流进来了"。

画外音说太满。声音从头讲到尾,没有任何留白。真正好的 demo 视频有画外音停下、让 UI 说话的瞬间。修法:把画外音写得比你以为舒服的版本再少 25-30%,然后相信画面。

CTA 三方共识。市场要"开始免费试用",销售要"预约 demo",产品要"看文档"。一支视频里三个 CTA = 零个 CTA。按渠道选一个,不要按组织架构选。

Demo 慢慢过期。半年后视频里的 UI 跟产品对不上了。原本带来转化的视频开始让用户困惑。结构性修法:每季度重生成,不是每年。有 agent + 存好的 brief 模板,重生成只需要一个下午。

不带字幕。社媒和嵌入位 85% 的播放是静音的。不带烧录字幕的 demo 视频 = 85% 的观众没听懂。字幕不是可选项。

Genra 在这套工作流里的位置

上面这套工作流是工具无关的——任何端到端 AI 视频 agent 都能跑。Genra 是我们做的 agent,也是这份指南实测的对象。Genra 在 SaaS demo 工作流里的具体贡献:

  • Brief-first 输入。前面那份 brief 模板在 Genra 里是真实的工件,不是聊天框 prompt。可以保存、复用、随产品迭代版本化。
  • 品牌素材库。Logo、配色、声音 profile、出镜形象参考一次上传,每次生成都自动调用。30 秒 hero demo 和 3 分钟引导视频可以做到视觉一致,不需要每条单独盯品牌。
  • 端到端制作。Brief 进,成片出——字幕、音频、剪辑、导出全部一站完成。不需要拼接片段、不需要单独配音步骤、不需要交接给剪辑师。
  • 多格式输出。同一个会话里基于相关 brief 同时生成格式 A 30 秒、格式 B 90 秒、格式 C 3 分钟,共享同一个品牌库和视觉风格。

如果你想这一周就上线第一支 AI 制作的 SaaS demo,Genra 给 40 个免费额度,无需绑卡。从 genra.ai 开始

关键要点

  • 选一个格式。格式 A(30 秒 hero)放首页,格式 B(90 秒巡览)放产品页,格式 C(3-5 分钟)放产品内引导。不要混。
  • 用 3 段式脚本公式:痛点 → 产品登场 → 后置状态 + 一个 CTA。讲结果,不讲功能。
  • Brief 是工作单元。在结构化 brief 上花 20 分钟,可以省掉跟外包来回扯皮的所有时间。
  • 发布前做一轮人工评审:信息保真度、品牌保真度、前 3 秒测试。第 3 遍不过就重生成。
  • 嵌入 5 个位置,不是 1 个:首页、产品页、激活邮件、应用商店、销售 deck。
  • 每季度重生成。一支过期的 demo 比一支新做的代价大得多。
  • 字幕是必须项。85% 的播放是静音的。

常见问题

用 AI 做一支 SaaS demo 视频需要多久?

格式 A 30 秒 hero demo:端到端大约半天——脚本 2 小时、Brief 30 分钟、agent 生成 20 分钟、人工评审 30 分钟。格式 C 3-5 分钟引导视频,预算一整天。最长的步骤永远是脚本。Agent 不缩短脚本时间,那部分是人工活。

如果我的产品 UI 复杂,能用 AI 做 demo 吗?

可以,有一点要注意。AI agent 在 demo 的叙事和结果层(第一幕痛点、第三幕后置状态、画外音、字幕、品牌包装)非常擅长。第二幕真正的 UI 走查环节,很多团队用混合方式:UI 走查段用真实产品屏录,其他所有段(开场、收尾、画外音、转场、动效)由 AI 生成。Agent 把真实 UI 视频拼进整体制作里。这是技术型 SaaS demo 目前的主流做法。

SaaS demo 视频合适的时长是多少?

按格式:hero demo 30 秒、功能巡览 90 秒到 2 分钟、引导视频 3 到 5 分钟。"做长一点"的本能几乎总是错的。社媒 30 秒后、产品页 90 秒后、其他场景 3 分钟后,完播率会断崖式下降。如果你在这些窗口里讲不完,问题是脚本太肿,不是时长不够。

Demo 视频多久更新一次?

UI 变化快的早期 SaaS 每季度一次。UI 稳定的成熟产品一年两次。判断依据不是日历,而是视频里的 UI 还跟用户注册之后看到的产品对得上吗。一旦这两者明显错位,demo 就开始拖累转化而不是帮助转化。

需要画外音吗?

格式 A(30 秒 hero)和格式 B(功能巡览):需要——"画外音 + 字幕"在静音/开声混合观看场景下大幅优于"只字幕"。格式 C(产品内引导):看情况——如果嵌在产品里,画外音可选,因为 UI 就在用户面前;如果放在邮件里,画外音必须有,邮件里的人通常没登录。

Genra 处理 SaaS demo 跟通用视频工具有什么不同?

Genra 是 brief-first 设计的,这点对 B2B 重要,因为 B2B demo 对信息保真度的要求很高。Brief 模板(产品背景、目标观众、格式、脚本、视觉风格、品牌素材、渠道、必须包含/必须避免)在工具里是真实工件,不是聊天 prompt。品牌素材库让第 14 支 demo 跟第 1 支保持视觉一致,不需要每条单独把关。端到端制作链路意味着你不需要在 3 个工具之间倒手才能从脚本走到成片。Genra 提供 40 个免费额度,无需绑卡,可以本周就跑一支 pilot。从 genra.ai 开始


关于作者
Genra AI 团队致力于打造帮助企业用 AI 制作专业视频内容的工具。关注 @GenraAI 获取最新动态、教程和 AI 视频领域的真实观点。