I/O 2026 Vooravond: 5 Echte Vragen in AI-video (Niet 5 Nieuwe Modellen)
· Chris ShermanGoogle I/O 2026 opent over minder dan 24 uur. Het internet hangt vol met Veo 4-voorspellingsposts. Iedereen stelt dezelfde vraag: welke specs heeft het nieuwe model? Dat is de verkeerde vraag. De vijf vragen die AI-video op dit moment écht vormgeven, hebben heel weinig te maken met welk model morgen wint.
Het is de avond van 18 mei 2026. Morgenochtend stapt Sundar Pichai het podium op en kondigt de volgende generatie Veo aan. Elke AI-video-maker, marketeer en analist zit dezelfde Twitter-timelines te verversen, wachtend op gelekte specs.
Een tegen-intuïtieve mening: de aankondiging morgen verandert vermoedelijk niet veel. Niet omdat hij niet indrukwekkend zal zijn — dat wordt hij waarschijnlijk wel. Maar omdat de daadwerkelijk onopgeloste problemen in AI-video al voorbij "welk model heeft de beste output" zijn. Die problemen zitten een laag hoger, in het gat tussen een clip en een afgewerkte video. Een betere Veo dicht dat gat niet. Een betere agent wel.
Hieronder vijf vragen die belangrijker zijn dan de keynote morgen. Lees ze, en geniet daarna van de show.
Vraag 1: Waarom breekt consistentie tussen clips nog steeds?
Elk AI-videomodel in 2026 kan een mooie clip van acht seconden maken. Draai het opnieuw met dezelfde prompt en je krijgt een ander persoon, een ander product, een andere merkkleur, een andere achtergrond. Het model heeft geen geheugen tussen generaties.
Voor een eenmalig cinematografisch shot is dat prima. Voor alles wat ook maar op een echte video lijkt — een productdemo met drie hoeken, een reclame met een verteller die in shot één en vier verschijnt, een cursusmodule met een vaste presentator — is dat het hele probleem.
Het antwoord van de modellaag is conditioning op referentiebeelden: upload drie foto's van een personage, het model probeert ze te matchen. Werkt misschien 70% van de tijd. De resterende 30% is waar de meeste echte productie-uren naartoe gaan.
Het antwoord van de agent-laag is anders: onderhoud een referentieset per entiteit (personage, product, omgeving) over de hele sequentie, regenereer mislukte shots automatisch, lock seeds waar consistentie ertoe doet, en versie referenties zodat brand assets stabiel blijven over maanden content. De modelverbetering helpt. De orkestratie is wat het leverbaar maakt.
Wat morgen niet gaat oplossen: Veo 4 levert mogelijk native ID-embedding. Wordt beter dan vandaag. Lost geen consistentie op voor een marketeer die maandelijks 40 clips over 8 product-SKUs produceert zonder erbij na te denken.
Vraag 2: Waarom wordt "clip" nog steeds verward met "afgewerkte video"?
Kijk naar elke modeldemo en je ziet hetzelfde: één shot, perfect uitgelicht, geen knippen, geen ondertiteling, geen muziek, geen platform-specifieke framing, geen CTA. Het is een clip. Het is geen video die iemand daadwerkelijk zou publiceren.
Een echte video — het soort dat naar een YouTube-kanaal, een TikTok-feed, een advertentieaccount, een productpagina gaat — heeft een script, scèneplanning, voice-over, B-roll, ondertiteling in de doeltaal, knippen op de beat, een hook in de eerste drie seconden, en een outputformaat afgestemd op het bestemmingsplatform. Het model regelt één van die dingen. De andere tien zijn iemands handmatige probleem.
De huidige standaardoplossing is vijf tools aan elkaar naaien: een scriptschrijver, een videomodel, een stemgenerator, een editor, een captioning-tool. Elke tool heeft zijn eigen UI, eigen prijsstelling, eigen failure modes. Resultaat: voor iedereen die kwaliteit serieus neemt, kost "AI-video" nog altijd uren per afgewerkt asset.
Het antwoord van de agent-laag is om de volledige pipeline als één systeem te bezitten. Brief in natuurlijke taal erin, afgewerkte video eruit. Genra draait op Veo en Seedance en regelt elke stap ertussenin. Dat is geen workflow-verbetering. Dat is een andere productcategorie.
Wat morgen niet gaat oplossen: Veo 4 produceert betere clips. Het gat tussen clip en afgewerkte video blijft precies waar het is.
Vraag 3: Wat gebeurt er over 11 dagen met AI-video-auteursrecht?
Op 29 mei 2026 gaat de MiniMax-auteursrechtszaak de zittingsfase in. Het is de eerste grote AI-video-auteursrechtzaak die een inhoudelijke uitspraakfase bereikt, en de uitkomst zet een precedent waar de hele industrie jaren mee zal moeten leven.
De vragen die aan de rechtbank worden voorgelegd, zijn onder andere: mag een model worden getraind op auteursrechtelijk beschermd materiaal zonder licentie? Wie is aansprakelijk wanneer een door AI gegenereerde clip wezenlijk lijkt op een auteursrechtelijk beschermde scène — de modelaanbieder, het platform of de eindgebruiker? Wat betekent "wezenlijk gelijk" eigenlijk wanneer het model miljoenen trainingsvideo's heeft gezien?
Dit telt om één reden zwaarder dan de keynote morgen: een Veo 4-aankondiging is een product. Een auteursrechtuitspraak is een randvoorwaarde die elk product vormgeeft. Valt de uitspraak één kant op, dan worden de safe harbor-aannames waaronder elke westerse AI-video-provider nu opereert opnieuw geschud. Valt het de andere kant op, dan wordt de gracht rond trainingsdata een echt verdedigbaar bezit.
Slimme makers en brand teams wachten niet op de uitspraak. Ze behandelen commerciële AI-video als iets dat een verdedigbare bewijsketen nodig heeft — welke modellen zijn gebruikt, welke referenties zijn geüpload, welke toestemmingen zijn verkregen. Genra's pipeline logt dit standaard, omdat we verwachten dat de regelgevende bodem zal blijven schuiven.
Wat morgen niet gaat oplossen: Google zal de MiniMax-zaak niet op I/O behandelen. De juridische bodem onder ieders voeten blijft schuiven, ongeacht met welke specs Veo 4 uitkomt.
Vraag 4: Waar gaat een afgewerkte AI-video eigenlijk naartoe?
Je hebt een video gegenereerd. En nu? Hij moet landen op YouTube als 16:9, op TikTok als 9:16, op Instagram Reels met ingebrande ondertitels voor autoplay, op je landingspagina als ingebedde MP4, op een betaald advertentieplatform met de eerste drie seconden opnieuw geknipt als hook-variant, en op je e-maillijst als thumbnail die linkt naar een gehoste player.
Elke bestemming heeft zijn eigen aspect ratio, lengtelimiet, bestandsgroottelimiet, ondertitelingsformaat, toegankelijkheidsvereiste en analytics-integratie. Het model produceert één gerenderde output. Het distributiewerk is een afzonderlijk, groter en grotendeels handmatig project.
Dit is het deel van AI-video dat niemand op I/O demonstreert. Het is ook het deel dat bepaalt of de video geld opbrengt of in een map blijft liggen.
Het antwoord van de agent-laag is om distributie tot een first-class output te maken. Dezelfde brief, meerdere platform-native cuts, parallel gegenereerd, geoptimaliseerd voor het werkelijke gedrag van elk oppervlak — TikToks algoritme beloont niet dezelfde hookstructuur als YouTube Shorts, en Instagram Reels geeft de voorkeur aan een totaal ander eerste frame.
Wat morgen niet gaat oplossen: Betere generatie lost distributie niet op. De platformen blijven gefragmenteerd. Het werk om aan elk te voldoen blijft hetzelfde. Of de agent-laag neemt het op zich, of de gebruiker.
Vraag 5: Wanneer stopt AI-video met een kostenpost te zijn?
Google maakte Veo 3.1 in april gratis. De kosten van het genereren van losse clips stortten in voor iedereen die een watermerk en een limiet van 8 seconden accepteert. Gratis modellen zijn overal. Waarom blijven AI-video-budgetten in de meeste bedrijven dan groeien?
Omdat de modelkosten nooit het knelpunt waren. Het knelpunt is het werk eromheen: het prompt engineering, het handmatig aan elkaar plakken, het babysitten van consistentie, het knippen per platform, de iteratieloops met stakeholders, de brand QA. Een gratis model legt de regelpost plat die toch al een afrondingsfout was en laat de echte kostenstructuur ongemoeid.
De bedrijven die AI-video van "experiment" naar "infrastructuur" hebben verplaatst, deden dat door de agent-laag als kosteneenheid te behandelen, niet het model. Ze meten kosten per afgeleverde afgewerkte video, niet kosten per gegenereerde clip. Die cijfers wijzen naar een andere conclusie dan het gratis-modelverhaal suggereert.
Voor de meeste teams ziet het pad om AI-video een winstcentrum te maken er zo uit: bezit de brief-naar-afgewerkt pipeline in één tool, elimineer de vijf-tools-naai-belasting, meet output per week per operator, en laat de modellaag eronder commoditiseren. De kosten van het model gaan naar nul. De kosten van de agent-laag bepalen de unit economics.
Wat morgen niet gaat oplossen: Zelfs als Veo 4 bij lancering gratis is, groeit je AI-video-budget volgend kwartaal vermoedelijk. De regel die uitdijt is niet modelgebruik. Het is alles eromheen.
Het grotere punt
De keynote morgen wordt een geweldige show. Native 4K komt eraan. Multi-scène-narratieven komen eraan. Snellere generatie komt eraan. We integreren elke betekenisvolle verbetering die Google uitbrengt, omdat betere modellen elke video op Genra oprecht een beetje beter maken.
Maar de vijf vragen hierboven worden niet beantwoord door een beter model. Ze worden beantwoord door een betere agent, een rijpend juridisch kader, en een industrie die stopt met demo's te verwarren met productie.
Bekijk morgen de keynote. Kom dan terug en vraag of er iets in zat dat de naald echt heeft verzet op consistentie, op clip-naar-afgewerkt, op auteursrecht, op distributie of op echte unit economics. Onze voorspelling: een beetje op de eerste, bijna niets op de rest.
De modellaag is de kop. De agent-laag is het werk.
Belangrijkste punten
- Google I/O 2026 wordt gedomineerd door Veo 4-voorspellingen en -aankondigingen. Het model is één laag in een veel hogere stack.
- Consistentie tussen clips is voornamelijk een orkestratieprobleem, geen modelprobleem. Native ID-embedding helpt; het dicht het gat niet voor iemand die maandelijks 40 clips levert.
- Een clip is geen afgewerkte video. Script, voice-over, B-roll, ondertiteling, platform-cuts en distributie zijn allemaal aparte problemen die het model niet aanraakt.
- De MiniMax-auteursrechtszitting op 29 mei zal de regulering van AI-video meer vormgeven dan welke I/O-aankondiging dan ook. Operators zouden nu provenance moeten loggen, niet later.
- Distributiefragmentatie over YouTube, TikTok, Instagram, ads en e-mail is zijn eigen productiebelasting. De agent-laag neemt het op zich of de gebruiker.
- Gratis modellen leggen de goedkoopste regelpost in AI-videoproductie plat. Echte unit economics worden bepaald door alles om het model heen — de agent-laag.
- Genra draait op Veo en Seedance en behandelt de hele pipeline als één agent. De modelverbeteringen van morgen vouwen stilletjes in de backend. De vijf echte vragen blijven waar ze waren.
Veelgestelde vragen
Wat is de agent-laag in AI-video?
De agent-laag is het systeem dat een brief verandert in een afgewerkte, distribueerbare video. Hij regelt scripting, scèneplanning, modelselectie, generatie, consistentie, voice-over, montage, captioning en platform-specifieke output. De modellaag genereert clips. De agent-laag levert video's.
Gaat Veo 4 AI-video-consistentie oplossen?
Deels. Als Veo 4 zoals verwacht native ID-embedding meebrengt, verbetert single-shot consistentie. Multi-clip-, multi-shoot-, brand-stabiele consistentie over een doorlopende contentpipeline vereist nog steeds orkestratie — referentiebeheer, regeneratielogica, seed locking, versiebeheer. Het model helpt. De agent doet het werk.
Wat is de MiniMax-auteursrechtszaak en waarom telt het?
De MiniMax-zaak is de eerste grote auteursrechtkwestie over AI-video die een inhoudelijke zitting bereikt, gepland voor 29 mei 2026. De uitspraak zal beïnvloeden hoe trainingsdata, aansprakelijkheid voor modeloutput en wezenlijke gelijkenis in de hele industrie worden geïnterpreteerd. De uitkomst vormt regulering voor zowel westerse als Aziatische providers.
Als Veo 3.1 gratis is, waarom is AI-video produceren niet gratis?
Omdat het model nooit het dure deel was. Het dure deel is het werk om het model heen — prompt-iteratie, handmatig stitchen, consistentie-QA, platformknippen, stakeholder-loops. Gratis modellen leggen de goedkoopste regelpost plat. De echte productiekosten leven in de agent-laag.
Welke modellen gebruikt Genra?
Veo en Seedance. De agent kiest welk model per shot wordt gebruikt op basis van de vereisten. Gebruikers beschrijven wat ze willen; de agent regelt de modelselectie en de rest van de pipeline.
Wanneer is Google I/O 2026?
19–20 mei 2026. De openingskeynote begint op 19 mei om 13:00 ET / 10:00 PT, gratis livestream op io.google. Veo- en Gemini-aankondigingen vallen meestal in de eerste 90 minuten.
Hoe moeten merken zich voorbereiden op auteursrecht-onzekerheid in AI-video?
Log provenance voor elke video: welke modellen welke clips hebben gegenereerd, welke referentiematerialen zijn geüpload, welke toestemming of licentie er voor die referenties bestaat. Behandel het audit trail als een deliverable, niet als bijzaak. De juridische bodem blijft de komende twee jaar bewegen.
Waarom kost platformdistributie nog steeds zoveel handmatig werk?
Omdat elk platform andere aspect ratios, lengtelimieten, ondertitelformaten, hookpatronen en algoritmische voorkeuren heeft. Eén gerenderde output presteert zelden goed over alle oppervlakken. Of de agent genereert platform-native varianten vanuit dezelfde brief, of iemand knipt handmatig opnieuw.
Over de auteur
Chris Sherman behandelt AI-videotechnologie, agent-architecturen en de business van creatieve productie. Volg @GenraAI voor live coverage van Google I/O 2026 (19–20 mei) en de MiniMax-zitting (29 mei).