SaaS-Produktdemo-Video mit KI erstellen: Schritt-für-Schritt-Anleitung

· Genra AI

Die meisten SaaS-Demovideos brauchen zwei Wochen, drei Meetings und einen Freelancer, der auf halber Strecke verschwindet. Hier ist, wie Sie ein poliertes Demovideo an einem Tag mit einem KI-Agent ausliefern — inklusive der drei Formate, die Sie wirklich brauchen, einer 3-Akt-Skriptformel, die jede Produktänderung übersteht, dem Brief-Template, das beim ersten Generieren ein nutzbares Ergebnis liefert, und den fünf Stellen, an denen das fertige Video Anmeldungen erzeugt.

Das SaaS-Produktdemo-Video ist eines der wirkungsstärksten Assets im B2B-Marketing. Es ist die Seite, die Cold Traffic in Trials konvertiert. Es ist der E-Mail-Anhang, der einen festgefahrenen Deal aufweckt. Es ist die App-Store-Vorschau, die entscheidet, ob ein bezahlter Install passiert oder nicht. Trotzdem veröffentlichen die meisten B2B-Teams ihr Demovideo etwa einmal pro Jahr — weil der Produktionsablauf (Brief, Skript, Bildschirmaufnahme, Voiceover, Schnitt, drei Stakeholder-Runden) so schwerfällig ist, dass das Video nicht mit dem Produkt mithält. Sechs Monate später zeigt das Demo eine UI, die es nicht mehr gibt.

Das ändert sich, wenn der Produktionsablauf von zwei Wochen auf einen Tag schrumpft. Diese Anleitung beschreibt den tatsächlichen Workflow, den B2B-Teams mit einem KI-Agent verwenden: Format wählen, Skript schreiben, Agent briefen, ein menschlicher Review-Pass, ausliefern. Der längste Schritt ist das Skript. Den Rest macht der Agent.

Schritt 1 — Wählen Sie eines der drei Formate (mischen Sie nicht)

Bevor Sie ein einziges Wort des Skripts schreiben, entscheiden Sie das Format. Der häufigste Fehler bei einem SaaS-Demovideo ist, alle drei Aufgaben in einem Asset erledigen zu wollen — und mit einem fünfminütigen Video zu enden, das niemand zu Ende ansieht. Wählen Sie eines.

Format A — 30-Sekunden-Hero-Demo

Lebt oben auf Ihrer Homepage. Spielt stummgeschaltet automatisch mit Untertiteln. Aufgabe: in 30 Sekunden vermitteln, was Ihr Produkt ist und was sich für den Nutzer ändert. Keine Features. Keine Preise. Keine Gründerstory. Nur das Vorher-Nachher des Nutzeralltags. Das Hero-Demo entscheidet, ob jemand weiterscrollt oder auf "Kostenlos starten" klickt.

Format B — 90-Sekunden- bis 2-Minuten-Feature-Tour

Lebt auf einer /product- oder /features-Seite. Manchmal in Sales-Mails eingebettet. Aufgabe: durch die drei bis fünf Kernfeatures in der Reihenfolge gehen, in der ein echter Nutzer sie berühren würde. Dies ist das Format, auf das die meisten Teams reflexartig zurückgreifen. Es ist nur dann richtig, wenn der Nutzer schon ungefähr weiß, was Ihr Produkt ist, und prüft, ob die Fähigkeiten passen.

Format C — 3-5-Minuten-Onboarding-/First-Day-Video

Lebt im Produkt (Welcome-Screen nach Anmeldung, Empty State, Help Center) und in der Aktivierungs-Mail-Sequenz. Aufgabe: einen brandneuen Nutzer von "Ich habe mich gerade angemeldet" zu "Ich habe meine erste wertvolle Aktion abgeschlossen" zu führen. Dieses Format treibt die Aktivierungsrate, nicht die Anmelderate.

Wenn Sie bei null mit Demovideos anfangen, liefern Sie zuerst Format A. Es bewegt die Konversionskennzahl, die für SaaS in der Frühphase am wichtigsten ist. Format B und Format C kommen zweitens und drittens.

Schritt 2 — Schreiben Sie das Skript mit der 3-Akt-Formel

Dies ist die Formel, die jede Produktänderung, jede Botschaftsanpassung und jeden Stakeholder-Review übersteht. Drei Akte, in dieser Reihenfolge, mit klarer Aufgabe für jeden.

Akt 1 — Der Schmerz (15-25% der Laufzeit). Eröffnen Sie mit der aktuellen Realität des Nutzers, nicht mit Ihrem Produkt. Zeigen Sie das Spreadsheet, das er manuell pflegt, das Postfach, in dem er ertrinkt, das Dashboard, das jeden Montag 40 Minuten zum Bauen braucht. Der Zuschauer muss in den ersten 5 Sekunden seinen eigenen Tag wiedererkennen. Wenn nicht, springt er ab.

Akt 2 — Das Produkt erscheint (50-60% der Laufzeit). Jetzt erscheint Ihr Produkt, und der Zuschauer sieht dieselbe Aufgabe in einem Bruchteil der Zeit, mit einem Bruchteil der Schritte erledigt. Hier zeigen Sie die echte UI bei der echten Arbeit. Entscheidend: Erzählen Sie keine Features, erzählen Sie Ergebnisse. "Verbinden Sie Ihre Datenquellen mit zwei Klicks" schlägt "OAuth-basierte Connector-Bibliothek mit 200+ Integrationen" jedes Mal — auch wenn das Zweite technisch genauer ist.

Akt 3 — Der Schluss (15-25% der Laufzeit). Zeigen Sie den Nachher-Zustand und den Call-to-Action. Das Montagsdashboard ist jetzt in 4 statt 40 Minuten gebaut. Das Postfach ist auf null. Das Team liefert. Enden Sie mit einem einzigen, eindeutigen CTA: "Kostenlos starten" / "Demo buchen" / "An Ihren Daten testen". Wählen Sie eins. Niemals zwei.

Die 3-Akt-Formel funktioniert für alle drei Formate. Die Laufzeit ändert sich, die Proportionen bleiben gleich. Format A komprimiert Akt 1 auf 5 Sekunden und Akt 3 auf 5 Sekunden. Format C dehnt Akt 2 zu einer schrittweisen Walkthrough. Die Struktur bleibt.

Schritt 3 — Briefen Sie den KI-Agent (verwenden Sie dieses Template)

Agenten rendern genau das, was Sie beschreiben. Vage Briefs erzeugen vage Videos. Der Brief unten dauert etwa 20 Minuten, sobald Sie das Skript haben, und ist die Arbeitseinheit, mit der der Agent operiert.

Produktkontext (3 Sätze). Was das Produkt tut, wer es benutzt, was es ersetzt. Beispiel: "Acme ist eine B2B-Billing-Plattform für nutzungsbasierte SaaS-Unternehmen. Es wird von Finance- und RevOps-Teams in Unternehmen mit 5-50 Mio. ARR genutzt. Es ersetzt selbstgebaute Billing-Skripte plus Stripe Billing." Drei Sätze. Mehr nicht.

Zielzuschauer (1 Satz). Die eine Person, die Sie konvertieren wollen. Beispiel: "Head of Finance in einer Series-B-SaaS, die nutzungsbasiertes Billing aktuell in Spreadsheets plus Stripe-Webhook-Glue-Layer pflegt."

Format und Laufzeit. "Format A — 30-Sekunden-Hero-Demo, vertikal 9:16 für Social, horizontal 16:9 für Homepage-Einbettung."

Das Skript. Fügen Sie das vollständige Akt-1-/Akt-2-/Akt-3-Skript ein. Markieren Sie jeden Akt explizit. Geben Sie pro Beat die exakte Voiceover-Zeile und die On-Screen-Aktion an, die sie begleitet.

Visueller Stil. Drei Adjektive. Beispiel: "klar, technisch, selbstbewusst." Dann ein Absatz Erläuterung: "Klar = großzügige Weißräume, keine unnötigen Motion Graphics. Technisch = echte Produkt-UI, echte Daten, echte Zahlen — keine Platzhalter. Selbstbewusst = keine Entschuldigungen, kein 'wir hoffen', kein Soft Sell."

Markenassets. Logodatei, Primärfarbe HEX, Sekundärfarbe HEX, Schriftname (oder -datei). Bei On-Camera-Sprechern Stimm-Profil und Charakterreferenz.

Distributionskanal. Wo dieses Video leben wird. Sagt dem Agent das richtige Seitenverhältnis, den Untertitelstil und die ersten 3 Sekunden. Eine Homepage-Einbettung liest sich anders als eine LinkedIn-Anzeige als ein In-Product-Activation-Modal.

Must-include und Must-avoid. Zwei kurze Listen. Must-include: bestimmte UI-Screens, bestimmte Phrasen, bestimmte CTAs. Must-avoid: Mitbewerbernamen, regulatorische Aussagen ohne Beleg, Lieblingsphrase des Gründers, die sonst niemand mag.

Speichern Sie diesen Brief als wiederverwendbares Template. Künftige Demos für dasselbe Produkt nutzen die meisten Felder weiter und tauschen nur Skript und Kanal.

Schritt 4 — Generieren, dann ein menschlicher Pass

Der Agent fährt die ganze Produktionsstrecke: Skript-zu-Shots, Shots-zu-Audio, Audio-zu-Schnitt, Schnitt-zu-Export. Für ein 30-Sekunden-Format-A-Video ist die erste Generation in etwa 10-20 Minuten fertig. Für ein 3-5-Minuten-Format-C-Onboarding-Video erwarten Sie 30-60 Minuten.

Veröffentlichen Sie die erste Generation nicht. Machen Sie vor dem Publish einen strukturierten menschlichen Pass.

Schauen Sie das Video dreimal hintereinander, jedes Mal mit Fokus auf eine Klasse von Problem:

  • Pass 1 — Botschaftstreue. Zeigt Akt 2 wirklich das im Skript beschriebene Ergebnis, oder ist der Agent in Feature-Listing zurückgefallen? Passt der CTA in Akt 3 zum Kanal? Mit dem Skript daneben anschauen.
  • Pass 2 — Markentreue. Stimmen die Farben? Stimmt die Logo-Platzierung? Klingt das Voiceover wie Ihre Markenstimme? Sind die UI-Screens als Ihr Produkt erkennbar?
  • Pass 3 — 3-Sekunden-Test. Stummschalten. Nur die ersten 3 Sekunden. Erkennt der Zielzuschauer dort seinen eigenen Tag? Wenn nein, ist der Hook kaputt — Akt 1 im Brief korrigieren und neu generieren.

Wenn Pass 3 fehlschlägt, neu generieren. Wenn Pass 1 oder 2 nur kleine Probleme haben, Brief anpassen und nur das betroffene Segment neu generieren — nicht das ganze Video. Wenn alles passt, ausliefern.

Schritt 5 — In den fünf Stellen einbetten, die Anmeldungen treiben

Ein Demovideo, das nur auf der Homepage lebt, erfüllt 20% seiner Aufgabe. Dasselbe Video, mit den richtigen Schnitten, treibt Anmeldungen auf fünf verschiedenen Flächen:

  • Homepage Hero. Format A, 30 Sekunden, automatisch stumm, gelooped, mit eingebrannten Untertiteln. Above the fold.
  • Produkt-/Feature-Seite. Format B, 90 Sekunden bis 2 Minuten. Klick zum Abspielen, Audio standardmäßig an. Unterhalb des Hero-Pitches, oberhalb des Feature-Grids.
  • Onboarding-Mail-Sequenz. Format A in Mail 1 (Welcome), Format C in 90-Sekunden-Stücken über Mails 2-4. Animierte GIF-Vorschauen, die zum vollständigen Video verlinken — eingebettetes Video in E-Mail ist clientübergreifend unzuverlässig.
  • App-Store-/Extension-Listing. Format A neu geschnitten auf die exakte Spec des Stores (App Store: vertikal, max. 30 Sekunden, Untertitel an). Die Store-Vorschau ist eine der hebelstärksten 30 Sekunden im Funnel und die am häufigsten übersehene Stelle.
  • Sales-Decks und Outbound. Format B als Loom-artiges Asset, das AEs in Outreach einfügen. Dasselbe Video, untertitelt, auf Folie 2 jedes Sales-Decks. Reps, die es nutzen, melden 1,5-2x höhere Meeting-Akzeptanzraten.

Der 5-Flächen-Plan ist, was aus einem Demovideo einen echten Konversionshebel macht — anstatt eines Marketingartefakts. Die meisten Teams überspringen drei der fünf und wundern sich, warum ihr Demovideo "nichts bewegt hat".

Häufige Fallen (und wie man sie vermeidet)

Feature-Dumping in Akt 2. Der häufigste Failmode. Das Skript sagt "zeig unsere Integrations-Bibliothek" und das Video wird zu einer 45-Sekunden-Tour jedes Logos. Fix im Brief: jedes Feature-Substantiv durch ein Ergebnis-Verb ersetzen. "200+ Integrationen" wird zu "Ihre Daten fließen 5 Minuten nach der Anmeldung".

Über-Erzählen. Das Voiceover redet die ganze Laufzeit ohne Atempause. Echte Demovideos haben Momente der Stille, in denen die UI arbeitet. Fix im Skript: 25-30% weniger Voiceover schreiben als sich angenehm anfühlt — den Bildern vertrauen.

Stakeholder-Konsens beim CTA. Marketing will "Kostenlos starten", Sales "Demo buchen", Product "Doku lesen". Drei CTAs in einem Video = null CTAs. Wählen Sie nach Kanal, nicht nach Org-Chart.

Demo veralten lassen. Sechs Monate später passt die UI im Video nicht mehr zum Produkt. Das Video, das jetzt konvertiert, verwirrt später Kunden. Strukturell fixen: vierteljährlich neu generieren, nicht jährlich. Mit Agent und gespeichertem Brief-Template dauert das einen Nachmittag.

Untertitel weglassen. 85% der Social- und Embed-Views sind stummgeschaltet. Ein Demovideo ohne eingebrannte Untertitel ist ein Video, das 85% der Zuschauer nicht verstehen. Untertitel sind nicht optional.

Wie Genra in diesen Workflow passt

Der Workflow oben ist tool-agnostisch — jeder Ende-zu-Ende-KI-Video-Agent kann ihn fahren. Genra ist der Agent, den wir gebaut haben, und der, an dem dieser Leitfaden kalibriert ist. Was Genra spezifisch beiträgt:

  • Brief-First-Input. Das obige Brief-Template ist in Genra ein echtes Artefakt, kein Chat-Prompt. Speichern, wiederverwenden, mit dem Produkt versionieren.
  • Markenasset-Bibliothek. Logo, Farbpalette, Stimm-Profil, On-Camera-Referenz einmal hochladen, bei jeder Generation wiederverwenden. Das 30-Sekunden-Hero-Demo und das 3-Minuten-Onboarding-Video bleiben visuell konsistent ohne Pro-Video-Babysitting.
  • End-to-End-Produktion. Brief rein, fertiges Video raus — Untertitel, Audio, Schnitt, Export. Kein Clip-Stitching, keine separate Voiceover-Phase, keine Übergabe an einen Editor.
  • Multi-Format-Output. Format A 30s, Format B 90s und Format C 3min aus verwandten Briefs in einer Session generieren — alle teilen sich Markenbibliothek und visuellen Stil.

Wenn Sie Ihr erstes KI-gemachtes SaaS-Demo diese Woche ausliefern wollen: Genra hat 40 kostenlose Credits, ohne Karte. Bei genra.ai starten.

Wichtigste Erkenntnisse

  • Wählen Sie ein Format. Format A (30s Hero) für die Homepage, Format B (90s Tour) für die Produktseite, Format C (3-5min) für In-Product-Onboarding. Nicht mischen.
  • Nutzen Sie die 3-Akt-Skriptformel: Schmerz → Produkt erscheint → Nachher-Zustand mit einem CTA. Ergebnisse erzählen, keine Features.
  • Der Brief ist die Arbeitseinheit. 20 Minuten in einen strukturierten Brief stecken; 0 Minuten in Agentur-Hin-und-Her.
  • Ein menschlicher Pass vor dem Publish: Botschaft, Marke, 3-Sekunden-Test. Bei Fehlschlag Pass 3 neu generieren.
  • In 5 Flächen einbetten, nicht 1: Homepage, Produktseite, Onboarding-Mail, App-Store-Listing, Sales-Deck.
  • Vierteljährlich neu generieren. Ein veraltetes Demo kostet mehr als ein frisches.
  • Untertitel sind Pflicht. 85% der Views sind stumm.

Häufig gestellte Fragen

Wie lange dauert es, ein SaaS-Demovideo mit KI zu erstellen?

Format A 30-Sekunden-Hero-Demo: ungefähr ein halber Tag — etwa 2 Stunden Skript, 30 Minuten Brief, 20 Minuten Agent-Generation, 30 Minuten Review. Format C 3-5-Minuten-Onboarding plant einen ganzen Tag. Der längste Schritt ist immer das Skript. Der Agent verkürzt diesen Teil nicht.

Kann ich KI für ein Demo nutzen, wenn mein Produkt eine komplexe UI hat?

Ja, mit einer Nuance. KI-Agenten sind exzellent in der Narrativ- und Ergebnis-Schicht (Akt 1, Akt 3, Voiceover, Untertitel, Markenpolitur). Für den UI-Walkthrough in Akt 2 nutzen viele Teams einen Hybrid: echte Bildschirmaufnahme der Produkt-UI, KI-generiertes Drumherum (Intro, Outro, Voiceover, Übergänge, Motion Graphics). Der Agent näht das echte UI-Material in den Rest. Das ist das dominante Muster für technische SaaS-Demos.

Was ist die richtige Länge für ein SaaS-Demovideo?

Hero-Demo 30 Sekunden, Feature-Tour 90 Sekunden bis 2 Minuten, Onboarding-Video 3 bis 5 Minuten. Der Instinkt, Demos länger zu machen, ist fast immer falsch. Die Watch-Through-Rate fällt nach 30 Sekunden auf Social, 90 Sekunden auf einer Produktseite und 3 Minuten überall sonst stark ab. Wenn Sie es in diesen Fenstern nicht sagen können, ist das Skript aufgebläht — nicht die Laufzeit.

Wie oft sollte ich das Demovideo erneuern?

Vierteljährlich für Frühphasen-SaaS mit schnell wechselnder UI. Zweimal pro Jahr für späte Produkte mit stabiler UI. Auslöser ist nicht der Kalender — sondern ob die UI im Video noch dem Produkt entspricht, das der Nutzer nach der Anmeldung sieht. Sobald sich beides bedeutsam unterscheidet, schadet das Demo der Konversion mehr, als es nützt.

Brauche ich ein Voiceover?

Für Format A (30s Hero) und Format B (Feature-Tour): ja — Voiceover plus Untertitel schlägt Untertitel-only deutlich, gemischt über stumme und unstumme Sichtungen. Für Format C (In-Product-Onboarding): hängt ab — im Produkt eingebettet ist Voiceover optional (UI ist da), in einer E-Mail Pflicht (der Mail-Empfänger ist oft nicht eingeloggt).

Wie behandelt Genra SaaS-spezifische Demos anders als generische Video-Tools?

Genra ist Brief-first gebaut, was für B2B wichtig ist, weil B2B-Demos präzise Botschaftstreue erfordern. Das Brief-Template ist ein echtes Artefakt im Tool, kein Chat-Prompt. Die Markenasset-Bibliothek hält Demo Nr. 14 visuell konsistent mit Demo Nr. 1 ohne Pro-Video-QA. Der End-to-End-Loop bedeutet, Sie wechseln nicht zwischen drei Tools, um vom Skript zum Export zu kommen. Genra bietet 40 kostenlose Credits, ohne Karte. Bei genra.ai starten.


Über den Autor
Das Genra-AI-Team baut Tools, die Unternehmen helfen, professionelle Videoinhalte mit KI zu produzieren. Folgen Sie @GenraAI für Updates, Tutorials und ehrliche Einschätzungen zur KI-Video-Welt.