Comment créer une vidéo de démo produit SaaS avec l'IA : guide pas à pas

· Genra AI

La plupart des vidéos de démo SaaS prennent deux semaines, trois réunions et un freelance qui disparaît à mi-parcours. Voici comment livrer une démo soignée en un jour avec un agent IA — les trois formats dont vous avez vraiment besoin, une formule de script en 3 actes qui survit à chaque changement produit, le modèle de brief qui fait que l'agent produit du contenu utilisable dès la première génération, et où intégrer la vidéo pour qu'elle génère réellement des inscriptions.

La vidéo de démo produit SaaS est l'un des actifs à plus fort effet de levier en marketing B2B. C'est la page qui convertit le trafic froid en essais. C'est la pièce jointe qui réveille un deal en panne. C'est l'aperçu de l'App Store qui décide si une installation payante a lieu ou non. Pourtant, la plupart des équipes B2B publient une vidéo de démo environ une fois par an, parce que le pipeline — brief, script, capture d'écran, voix off, montages, trois rondes de revue — est si lourd que la vidéo ne suit pas le produit. Six mois plus tard, la démo montre une UI qui n'existe plus.

Cela change quand le pipeline passe de deux semaines à un jour. Ce guide décrit le workflow réel utilisé par des équipes B2B avec un agent IA : choisir le format, écrire le script, briefer l'agent, faire un passage humain, livrer. L'étape la plus longue est le script. L'agent fait le reste.

Étape 1 — Choisissez l'un des trois formats (ne mélangez pas)

Avant d'écrire un seul mot de script, décidez du format. L'erreur la plus fréquente est d'essayer de faire les trois jobs dans un seul actif et de finir avec une vidéo de cinq minutes que personne ne regarde jusqu'au bout. Choisissez-en un.

Format A — La démo hero de 30 secondes

Vit en haut de votre page d'accueil. Lecture automatique en mode muet, avec sous-titres. Job : en 30 secondes, communiquer ce qu'est votre produit et ce qui change pour l'utilisateur quand il l'utilise. Pas de fonctionnalités. Pas de prix. Pas d'histoire du fondateur. Juste l'avant/après de la journée de l'utilisateur. La démo hero détermine si quelqu'un continue à scroller ou clique sur "Démarrer l'essai gratuit".

Format B — Le tour des fonctionnalités de 90 secondes à 2 minutes

Vit sur une page /product ou /features. Parfois intégré dans des emails de vente. Job : parcourir les trois à cinq fonctionnalités centrales dans l'ordre où un utilisateur réel les toucherait. C'est le format vers lequel la plupart des équipes se tournent par défaut. Il n'est correct que lorsque l'utilisateur sait déjà à peu près ce qu'est votre produit et évalue si les capacités correspondent à ses besoins.

Format C — La vidéo d'onboarding/premier jour de 3 à 5 minutes

Vit dans le produit (écran de bienvenue post-inscription, état vide, centre d'aide) et dans la séquence d'emails d'activation. Job : amener un nouvel utilisateur de "je viens de m'inscrire" à "j'ai réalisé ma première action de valeur". Ce format pilote le taux d'activation, pas le taux d'inscription.

Si vous partez de zéro, livrez d'abord le Format A. Il bouge la métrique de conversion la plus importante pour le SaaS en début de parcours. Les Formats B et C viennent ensuite.

Étape 2 — Écrivez le script avec la formule en 3 actes

C'est la formule qui survit à chaque changement produit, chaque refonte du discours et chaque revue stakeholder. Trois actes, dans l'ordre, avec un job clair pour chacun.

Acte 1 — La douleur (15-25% du runtime). Ouvrez sur la réalité actuelle de l'utilisateur, pas sur votre produit. Montrez le tableur qu'il maintient à la main, l'inbox dans laquelle il se noie, le dashboard qui prend 40 minutes à construire chaque lundi. Le spectateur doit reconnaître sa propre journée dans les 5 premières secondes. Sinon, il décroche.

Acte 2 — Le produit entre (50-60% du runtime). Maintenant votre produit apparaît, et le spectateur voit la même tâche réalisée en une fraction du temps avec une fraction des étapes. Ici vous montrez la vraie UI faisant le vrai travail. Crucial : ne narrez pas des fonctionnalités, narrez des résultats. "Connectez vos sources de données en deux clics" bat à chaque fois "bibliothèque de connecteurs basée sur OAuth avec 200+ intégrations", même si la seconde est techniquement plus précise.

Acte 3 — La fermeture (15-25% du runtime). Montrez l'état d'après et le call-to-action. Le dashboard du lundi est désormais construit en 4 minutes, plus en 40. L'inbox est à zéro. L'équipe livre. Terminez sur un CTA unique et sans ambiguïté : "Démarrer gratuitement" / "Réserver une démo" / "Essayez sur vos données". Choisissez-en un. Jamais deux.

La formule en 3 actes fonctionne pour les trois formats. Le runtime change, les proportions restent. Le Format A comprime l'Acte 1 à 5 secondes et l'Acte 3 à 5 secondes. Le Format C étire l'Acte 2 en parcours pas-à-pas. La structure tient.

Étape 3 — Briefez l'agent IA (utilisez ce modèle)

Les agents rendent exactement ce que vous décrivez. Briefs vagues = vidéos vagues. Le brief ci-dessous prend environ 20 minutes une fois le script en main, et c'est l'unité de travail de l'agent.

Contexte produit (3 phrases). Ce que fait le produit, qui l'utilise, ce qu'il remplace. Exemple : "Acme est une plateforme de facturation B2B pour SaaS basés sur l'usage. Elle est utilisée par les équipes Finance et RevOps des entreprises de 5 à 50 M$ d'ARR. Elle remplace des scripts maison plus Stripe Billing." Trois phrases. Pas plus.

Spectateur cible (1 phrase). La seule personne que vous voulez convertir. Exemple : "Directeur Finance dans une SaaS Series B qui maintient actuellement la facturation usage-based dans des tableurs et une couche de glue de webhooks Stripe."

Format et durée. "Format A — démo hero de 30 secondes, vertical 9:16 pour le social, horizontal 16:9 pour intégration en page d'accueil."

Le script. Collez le script complet Acte 1 / Acte 2 / Acte 3. Marquez chaque acte explicitement. Indiquez à chaque beat la ligne de voix off exacte et l'action à l'écran qui l'accompagne.

Style visuel. Trois adjectifs. Exemple : "épuré, technique, confiant." Puis un paragraphe : "Épuré = espaces blancs généreux, pas de motion graphics inutiles. Technique = vraie UI produit, vraies données, vrais chiffres — pas de placeholder. Confiant = pas de langage d'excuse, pas de 'nous espérons', pas de soft sell."

Actifs de marque. Logo, couleur primaire HEX, secondaire HEX, police. Si vous avez un profil vocal ou une référence de présentateur en caméra, incluez-les.

Canal de distribution. Où la vidéo vit. Indique au agent le bon ratio, le style de sous-titres, les 3 premières secondes. Une intégration en homepage se lit autrement qu'une pub LinkedIn ou qu'un modal d'activation in-app.

Must-include et must-avoid. Deux courtes listes. À inclure : écrans UI précis, formulations précises, CTAs précis. À éviter : noms de concurrents, affirmations réglementaires non étayées, phrase fétiche du fondateur que personne d'autre n'aime.

Sauvegardez ce brief comme modèle réutilisable. Les futures démos du même produit reprennent la majorité des champs et ne changent que script et canal.

Étape 4 — Générez, puis un passage humain

L'agent fait tourner toute la chaîne : script-vers-shots, shots-vers-audio, audio-vers-montage, montage-vers-export. Pour un Format A 30 secondes, la première génération est prête en 10-20 minutes. Pour un Format C 3-5 minutes, comptez 30-60 minutes.

Ne publiez pas la première génération. Faites un passage humain structuré avant.

Regardez la vidéo trois fois de suite, chaque fois pour une classe de problème :

  • Passage 1 — fidélité du message. L'Acte 2 montre-t-il le résultat décrit dans le script, ou l'agent est-il retombé dans la liste de fonctionnalités ? Le CTA de l'Acte 3 correspond-il au canal ? Regardez avec le script ouvert à côté.
  • Passage 2 — fidélité de marque. Couleurs correctes ? Logo bien placé ? Voix off conforme à votre marque ? Écrans UI reconnaissables comme votre produit ?
  • Passage 3 — test des 3 premières secondes. Coupez le son. Regardez seulement les 3 premières secondes. Le spectateur cible reconnaîtrait-il sa journée ? Sinon, le hook est cassé — corrigez l'Acte 1 dans le brief et régénérez.

Si le Passage 3 échoue, régénérez. Si les Passages 1 ou 2 ont de petits soucis, modifiez le brief et demandez la régénération partielle du segment concerné, pas de toute la vidéo. Si tout passe, livrez.

Étape 5 — Intégrez aux cinq endroits qui génèrent des inscriptions

Une vidéo de démo qui ne vit que sur la page d'accueil fait 20 % de son job. La même vidéo, avec les bonnes coupes, génère des inscriptions sur cinq surfaces :

  • Hero de la page d'accueil. Format A, 30 secondes, autoplay muet, en boucle, sous-titres incrustés. Above the fold.
  • Page produit/fonctionnalités. Format B, 90s à 2 min. Click-to-play, audio activé par défaut. Sous le hero, au-dessus de la grille des fonctionnalités.
  • Séquence d'emails d'onboarding. Format A dans l'email 1 (bienvenue), Format C découpé en segments de 90s sur les emails 2-4. GIFs animés liant à la vidéo complète — la vidéo intégrée en email n'est pas fiable selon les clients.
  • Listing App Store/extension. Format A reformaté à la spec exacte (App Store : vertical, 30s max, sous-titres on). L'aperçu store est l'un des 30 secondes à plus fort levier du funnel et l'endroit le plus souvent oublié.
  • Decks de vente et outbound. Format B en actif type Loom que les AE collent dans leur outreach. Même vidéo, sous-titrée, en page 2 de chaque deck. Les commerciaux qui l'utilisent rapportent des taux d'acceptation de meeting 1,5-2x plus élevés.

Le plan en cinq surfaces transforme une seule vidéo de démo en levier de conversion réel. La plupart des équipes en sautent trois et se demandent pourquoi leur démo "n'a pas bougé l'aiguille".

Pièges courants (et comment les éviter)

Lister les fonctionnalités à l'Acte 2. L'échec le plus fréquent. Le script dit "montre notre bibliothèque d'intégrations" et la vidéo devient un tour de 45 secondes de chaque logo. Correction dans le brief : remplacez chaque substantif fonctionnalité par un verbe résultat. "200+ intégrations" devient "vos données circulent 5 minutes après l'inscription".

Sur-narration. La voix parle pendant tout le runtime sans respiration. Les vraies vidéos de démo ont des moments de silence où l'UI fait le travail. Correction : écrivez 25-30 % de voix en moins que ce qui semble confortable et faites confiance au visuel.

Consensus stakeholders sur le CTA. Marketing veut "Essai gratuit", ventes veut "Réserver une démo", produit veut "Lire la doc". Trois CTAs = zéro CTA. Choisissez selon le canal, pas selon l'organigramme.

Laisser la démo vieillir. Six mois plus tard, l'UI ne correspond plus. La vidéo qui convertissait désoriente désormais. Correction structurelle : régénérez chaque trimestre, pas chaque année. Avec un agent et un brief sauvegardé, la régénération prend un après-midi.

Sauter les sous-titres. 85 % des vues sociales et embed sont muettes. Une vidéo sans sous-titres incrustés n'est pas comprise par 85 % des spectateurs. Les sous-titres ne sont pas optionnels.

Comment Genra s'intègre à ce workflow

Le workflow est agnostique d'outil. Genra est l'agent que nous avons construit et celui contre lequel ce guide est calibré. Apport spécifique :

  • Input brief-first. Le modèle de brief est un véritable artefact dans Genra, pas un prompt de chat. Sauvegardez, réutilisez, versionnez avec le produit.
  • Bibliothèque d'actifs de marque. Logo, palette, profil vocal, référence de présentateur uploadés une fois et réutilisés à chaque génération. Le hero 30s et l'onboarding 3 min restent visuellement cohérents sans baby-sitting.
  • Production end-to-end. Brief en entrée, vidéo finie en sortie : sous-titres, audio, montage, export. Pas de stitching, pas d'étape voix off séparée, pas de handoff à un éditeur.
  • Sortie multi-format. Format A 30s, Format B 90s et Format C 3min depuis des briefs reliés en une session, partageant la même bibliothèque de marque.

Pour livrer votre première démo SaaS faite par IA cette semaine, Genra offre 40 crédits gratuits sans carte. Démarrez sur genra.ai.

Points clés

  • Choisissez un format. A (30s hero) page d'accueil, B (90s tour) page produit, C (3-5min) onboarding in-app. Ne mélangez pas.
  • Formule 3 actes : douleur → produit entre → état d'après avec un CTA. Narrer des résultats, pas des fonctionnalités.
  • Le brief est l'unité de travail. 20 minutes de brief structuré ; zéro minute d'allers-retours agence.
  • Un passage humain avant publication : message, marque, test des 3 premières secondes. Régénérez si Passage 3 échoue.
  • Intégrez sur 5 surfaces : page d'accueil, page produit, email onboarding, listing App Store, deck de vente.
  • Régénérez chaque trimestre. Une démo périmée coûte plus qu'une fraîche.
  • Sous-titres obligatoires. 85 % des vues sont muettes.

Questions fréquentes

Combien de temps pour faire une démo SaaS avec l'IA ?

Format A 30s : environ une demi-journée. Format C 3-5min : une journée complète. L'étape la plus longue reste le script.

L'IA convient-elle si mon produit a une UI complexe ?

Oui, en hybride : capture d'écran réelle pour le walkthrough UI, IA pour intro, outro, voix off, transitions, motion graphics. L'agent assemble.

Quelle longueur ?

Hero 30s, tour 90s à 2min, onboarding 3-5min. Le watch-through chute fortement après ces seuils.

À quelle fréquence rafraîchir ?

Trimestriel pour SaaS début, semestriel pour produits stables. Déclencheur : l'UI de la vidéo correspond-elle encore au produit après inscription ?

Faut-il une voix off ?

Hero et tour : oui. Onboarding in-app : optionnel ; en email : obligatoire.

En quoi Genra diffère ?

Brief-first : brief structuré comme artefact réel, bibliothèque de marque, pipeline end-to-end. 40 crédits gratuits sans carte. Démarrez sur genra.ai.


À propos de l'auteur
L'équipe Genra AI construit des outils qui aident les entreprises à produire du contenu vidéo professionnel avec l'IA. Suivez @GenraAI pour des mises à jour, tutoriels et avis honnêtes sur l'IA vidéo.