Google I/O 2026 samenvatting: geen Veo 4 — maar Gemini Omni en Spark maken de agent-laag officieel

· Chris Sherman

Twee maanden lang sprak de hele AI-video-industrie over Veo 4. Het kwam niet. Wat Google op I/O 2026 aankondigde was groter en vreemder: een verenigd multimodaal model genaamd Gemini Omni, een 24/7 in de cloud levende agent genaamd Spark, een AI Ultra-abonnement van $100 dat de consumentenprijsbodem herzet, en een duidelijk signaal dat Google de agent-laag nu ziet als het volgende platformgevecht. Hier is de volledige analyse.

Sundar Pichai betrad gisteren het podium van het Shoreline Amphitheatre en gaf de AI-video-industrie iets wat het niet verwachtte. Er was geen Veo 4. Er was helemaal geen kop met het "Veo"-merk. In plaats daarvan stond iets strategisch interessanters: Gemini Omni, een multimodaal model dat tekst-, beeld-, audio- en videogeneratie natively afhandelt in één systeem; Gemini Spark, een persoonlijke AI-agent die op een cloud-VM leeft en 24 uur per dag namens jou handelt; en een prijsherstructurering die een AI Ultra-abonnement van $100 in het hart van Googles consumenten-AI-weddenschap plaatst.

De keynote herschreef het script voor de komende 12 maanden van AI-video. Hieronder vind je alles wat Google aankondigde, wat het werkelijk betekent, en waar de AI-video-industrie nu staat de ochtend erna.

Gemini Omni: de kop die niemand voorspelde

De meest ingrijpende aankondiging was Gemini Omni — een nieuwe modelserie die Google beschrijft als het eerste echt verenigde multimodale generatiesysteem van het bedrijf. Waar Googles vorige line-up capaciteiten verspreidde over Veo (video), Imagen (beeld) en andere aan elkaar geschakelde systemen, verwerkt Omni tekst-, beeld-, audio- en videogeneratie native in één model.

Het eerste publieke model in het Omni-framework is Omni Flash. Het accepteert gecombineerde tekst-, beeld- en audio-invoer en levert korte cinematische video met gesynchroniseerd geluid. Google demonstreerde gebruikers die een stilstaand beeld uploadden, hardop instructies gaven en een geanimeerde scène met native audio terugkregen die op de gesproken aanwijzingen reageerde. Bewerking is gespreksgebaseerd — je verfijnt een clip door te zeggen wat moet veranderen, in plaats van een nieuwe prompt te schrijven en vanaf nul opnieuw te genereren.

Drie dingen maken Omni strategisch anders dan de Veo-lijn:

  • Eén model, geen stack. Veo 3 had al native audio, maar de bredere creatieve stack van Google leunde nog op het aaneenschakelen van aparte modellen voor beeldgeneratie, audiomontage en bewerking. Omni vouwt die keten op. De strategische implicatie is dat Google gelooft dat de volgende kwaliteitssprong komt uit gezamenlijke training over modaliteiten heen, niet uit het verder opschalen van pure videomodellen.
  • Wereldgebaseerde generatie. Demis Hassabis positioneerde Omni als voortbouwend op het wereldmodellenwerk van Google DeepMind. Het argument: Omni genereert video met sterkere ruimtelijke, temporele en fysieke samenhang omdat het onderliggende model een rijkere interne wereldrepresentatie heeft. Of de output dat in de praktijk waarmaakt is een vraag die we volgend kwartaal gaan benchmarken.
  • Bewerking als eersteklas mogelijkheid. Omni wordt niet alleen gepositioneerd als generator, maar ook als editor. Gespreksgebaseerde verfijning, scènewisselingen en remix-achtige bewerkingen maken deel uit van het productoppervlak, niet van een externe laag. Dit is een betekenisvolle verschuiving in productfilosofie waarop concurrenten zullen moeten reageren.

Wat Omni momenteel niet doet: lange vorm. Omni Flash is korte vorm, en Google was expliciet dat langere en geavanceerdere productieworkflows gepland zijn, maar nog niet zijn uitgebracht. Wie hoopte op een 60-seconden-narratiefgeneratie in één keer wacht nog steeds.

Gemini Spark: een 24/7 persoonlijke agent in de cloud

Als Omni de kop was die de meeste analisten verkeerd lazen, dan was Spark de meest onderschatte aankondiging.

Gemini Spark is een persoonlijke AI-agent die op een dedicated Google-cloud-VM leeft, continu draait en namens jou handelt via Google-producten en een groeiende lijst van diensten van derden via Model Context Protocol (MCP). De productbeschrijving in Googles eigen woorden: een agent die "restaurants kan boeken, een Instacart-bestelling kan plaatsen en je e-mailantwoorden kan opstellen terwijl je slaapt".

De strategische betekenis is moeilijk te overschatten. Twee jaar lang was Googles consumenten-AI-verhaal Gemini als chatbot. Spark is Google die expliciet zegt dat de chatbot de verkeerde frame was — de juiste frame is een autonome agent die werkt over applicaties en tijd heen. De agent leest je inbox, voert acties uit in je tools, plant over diensten heen en rapporteert terug. De gebruiker beschrijft uitkomsten; Spark verzorgt de uitvoering.

Dit is dezelfde these waarover de AI-video-industrie het afgelopen jaar heeft gediscussieerd, toegepast op algemene productiviteit. De agent-laag is niet meer een positioneringsgok van startups. Het is nu Googles positioneringsgok.

Prijs is hier belangrijk. Spark zit achter het nieuwe AI Ultra-abonnement van $100/maand en wordt volgende week in bèta uitgerold naar Amerikaanse abonnees. Alleen al de prijs signaleert dat Google denkt dat er een betekenisvolle populatie gebruikers is die bereid is negen keer meer te betalen dan het Gemini Pro-abonnement van $11 om een agent te krijgen die daadwerkelijk dingen doet.

Gemini 3.5: de foundation-update

Onder de Omni- en Spark-aankondigingen ligt een foundation-model-refresh. Gemini 3.5 Flash werd gisteren gelanceerd in de Gemini-app, Search, Antigravity en de Gemini API. Googles claim: het overtreft Gemini 3.1 Pro op coding-, agentic- en multimodale benchmarks terwijl het draait met ongeveer 4x de outputtokensnelheid van vergelijkbare frontier-modellen.

Gemini 3.5 Pro is aangekondigd maar nog niet algemeen beschikbaar. Het wordt getest en komt volgende maand uit.

Het patroon over Flash, Pro, Omni en Spark is consistent: elk product dat Google op I/O aankondigde is gebouwd op het spoor van agentic-capaciteiten. Snellere instructievolging, langere effectieve context, beter toolgebruik en betrouwbaarder meerstapsuitvoering. De modellaag wordt gevormd om de agent-laag erboven te bedienen.

Antigravity 2.0: het verhaal voor ontwikkelaars

Antigravity is Googles platform voor agent-ontwikkeling. Gisteren kreeg het een 2.0-upgrade gericht op orkestratie — waarmee ontwikkelaars meerdere agents kunnen samenstellen, plannen en bewaken die met elkaar en met externe tools interacteren.

De relevantie voor AI-video is indirect maar reëel. Naarmate meer AI-video-tools verschuiven van single-model-wrappers naar daadwerkelijk georkestreerde pijplijnen, wordt de onderliggende infrastructuur om die orkestraties te draaien, te monitoren en te debuggen een fundamentele afhankelijkheid. Antigravity 2.0 is Google die probeert die infrastructuurlaag te bezitten op dezelfde manier als ze de modellaag eronder bezit.

Of onafhankelijke agent-bouwers gaan leunen op Googles infrastructuur of die zelf gaan bouwen is een van de interessantere open vragen die uit deze keynote naar voren komen. Het antwoord bepaalt hoeveel van de agent-economie Google opvangt versus hoeveel oprecht open blijft.

Het AI Ultra-abonnement van $100: een reset van de prijsbodem

Google AI Ultra begint nu bij $100 per maand, met een hoger abonnement van $200. Het vorige Ultra-abonnement was $250. Het nieuwe instapabonnement omvat bètatoegang tot Gemini Spark, 5x de Gemini-app-gebruikslimiet van het Pro-abonnement van $20, 20TB cloudopslag en YouTube Premium.

De strategische lezing is rechttoe rechtaan: Google prijst premium consumenten-AI agressief om de early adopters te vangen die zullen bepalen hoe een agent-product aanvoelt. Voor $100/maand concurreert Spark nu rechtstreeks met de bovenkant van ChatGPT Pro en de Claude-consumentenabonnementen. De agent-functie is de differentiator — en het is een functie waarvan concurrenten in de komende 12 maanden versies zullen moeten uitbrengen, of de categorie productiviteits-agent moeten opgeven.

Voor creators en operators is de relevante vraag of $100/maand voor een persoonlijke agent het werk betekenisvol versnelt. Het eerlijke vroege antwoord: het hangt volledig af van of de Spark-bèta de demo waarmaakt. Demo's zijn demo's. We zullen het in 90 dagen weten.

Android XR en Project Aura: het hardware-oppervlak

Google onthulde ook nieuwe "intelligente brillen"-apparaten, waaronder Project Aura, de XR-klasse slimme brillen ontwikkeld in samenwerking met Xreal. Er worden dit jaar minstens drie smart-glasses-partnerschappen gelanceerd, waarmee Google zich positioneert tussen de audio-first Ray-Bans van Meta en volledige XR-headsets.

De AI-invalshoek: deze zijn Gemini-aangedreven. Live visuele context, spraakinteractie en agentic-actie — allemaal draagbaar. Voor AI-video zijn de implicaties stroomafwaarts maar reëel. Een draagbare camera met Gemini-context wordt een permanent invoerapparaat voor videocreatie, zowel voor referentievastlegging als voor live bewerking onderweg. We zijn 18 maanden verwijderd van het moment dat dit voor productieworkflows belangrijk wordt. We zijn nul maanden verwijderd van het moment dat dit voor consumenten-demo's belangrijk wordt.

Android 17: het OS als intelligentielaag

Sameer Samats Android-update positioneerde het OS zelf als transformerend "van een besturingssysteem naar een intelligentiesysteem". De framing — Gemini begrijpt context tussen apps, anticipeert op behoeften en onderneemt acties namens de gebruiker — is dezelfde agent-laag-these toegepast op het mobiele platform.

De concrete features doen er minder toe dan de framing. Google verbindt zich aan een toekomst waarin de OS-laag en de agent-laag samenvallen tot één stack, allemaal draaiend op Gemini-foundation-modellen. Voor ontwikkelaars betekent dit dat agent-bewust app-ontwerp geen optioneel patroon meer is; het is de basisaanname waaromheen Google het platform bouwt.

Wat niet uitkwam: de afwezigheid van Veo 4

De meest in de gaten gehouden verwachte aankondiging die niet gebeurde: Veo 4. Er was geen Veo 4-onthulling, geen Veo 4-tijdlijn en geen expliciete bevestiging dat Veo wordt uitgefaseerd ten gunste van de Omni-lijn.

De meest waarschijnlijke lezing: Google consolideert zijn generatieve video-inspanningen onder Omni in plaats van parallelle Veo-ontwikkeling voort te zetten. Omni Flash wordt gepositioneerd als het nieuwe startpunt. Veo 3.1 blijft de productiekwaliteit-optie voor use cases die Omni Flash nog niet dekt — met name langere single-shot-generatie, 4K-output en karakterconsistentie via ID-embedding, geen van alle wordt momenteel door Omni Flash ondersteund.

Voor de bredere AI-video-industrie is dit een betekenisvolle pivot. Achttien maanden van gesprek over "wat doet Veo hierna" is vervangen door "wat is Omni". Operators met Veo-specifieke automatisering moeten evalueren of ze wachten tot Omni volwassen wordt op lange vorm, of de productie de afzienbare toekomst op Veo 3.1 houden. Waarschijnlijk allebei, parallel, op verschillende contenttypes.

Wat dit betekent voor AI-video-operators

Terugstappend van de individuele aankondigingen veranderden gisteren drie dingen die AI-video voor het komende jaar zullen vormgeven.

Ten eerste werd de modelstrategie rommeliger op een nuttige manier. Omni is een verenigde multimodale weddenschap, maar Omni Flash is alleen korte vorm. Veo 3.1 doet nog steeds het zwaardere werk voor langere clips en hogere resoluties. Echte productiepijplijnen zullen beide gebruiken, ertussen routeren en dynamisch wisselen naarmate Omni volwassen wordt. De agent-laag is waar die routinglogica woont.

Ten tweede is agent-laag-denken nu consensus. Spark is Google die hardop zegt dat de chatbot-framing een overgangsstap was en de bestemming een autonome agent is. Elk consumenten- en bedrijfs-AI-productteam dat heeft gedebatteerd of het "een assistent" of "een agent" moet bouwen, heeft een uitgemaakt antwoord gekregen. De agent-laag is waar de concurrentie zich naartoe verplaatst.

Ten derde verandert gespreksgebaseerde bewerking de creator-workflows. Omni's nadruk op in-chat bewerking — een clip verfijnen door te beschrijven wat moet veranderen — vouwt op wat vroeger een tweestaps proces genereren-dan-bewerken was. Voor AI-video-creators is dit een betekenisvolle UX-vereenvoudiging die concurrenten geacht worden te evenaren. Genra's pijplijn ondersteunt al gespreksgebaseerde iteratie; verwacht dat elk serieus AI-videoplatform binnen zes maanden een versie hiervan uitbrengt.

Wat Genra hierna doet

Een paar eerlijke noten over waar Genra vanaf hier heen gaat.

Omni Flash wordt geïntegreerd zodra het beschikbaar wordt via de Gemini API. De agent-laag die Genra bouwt is precies model-agnostisch ontworpen zodat toevoegingen zoals Omni backend-wijzigingen worden, geen workflowwijzigingen. Gebruikers zullen een betere korte-vorm-output zien naarmate de routinglogica Omni Flash gaat kiezen voor de shots waarin het het beste presteert. Lange vorm, 4K en hoogconsistentie-gebruiken blijven draaien op Veo en Seedance.

Sparks framing als 24/7 cloud-residente agent is de dichtstbij gelegen validatie die we hadden kunnen vragen voor de agent-laag-these. Genra is een domeinspecifieke agent voor videoproductie. Spark is een algemene agent voor persoonlijke productiviteit. De twee bestaan comfortabel naast elkaar — op dezelfde manier waarop een CRM-agent en een coding-agent naast een algemene productiviteitsassistent bestaan.

Het grotere concurrentiekader: nu Google zich op platformniveau verbindt aan de agent-laag, is de vraag voor elke AI-video-startup niet langer "zijn agents de toekomst" — dat is beslist. De vraag is welke domeinspecifieke agents de vertrouwde keuze worden in hun categorie. Voor AI-video is dat de vraag waar Genra voor is gebouwd om te beantwoorden.

Belangrijkste punten

  • Google I/O 2026 leverde geen Veo 4. De belangrijkste video-aankondiging was Gemini Omni, een verenigd multimodaal model dat tekst-, beeld-, audio- en videogeneratie in één systeem afhandelt, met Omni Flash als eerste publieke model.
  • Gemini Spark, een 24/7 cloud-residente persoonlijke agent die handelt over Google-producten en via MCP verbonden diensten van derden, is de strategisch meest significante aankondiging. Het verbindt Google aan de agent-laag als volgend platformgevecht.
  • Gemini 3.5 Flash werd gisteren gelanceerd; Gemini 3.5 Pro wordt getest voor volgende maand. Elke foundation-update werd geformuleerd rond agentic-capaciteiten, niet alleen intelligentie.
  • AI Ultra werd herprijst naar $100/maand instap ($200 topabonnement), omlaag vanaf de vorige Ultra van $250. Spark-bètatoegang is beperkt tot het $100-abonnement voor Amerikaanse abonnees vanaf volgende week.
  • Antigravity 2.0 breidt Googles agent-ontwikkelplatform uit met orkestratietooling — de infrastructuurzet voor agent-bouwers.
  • De Android XR- en Project Aura-smart-glasses, plus Android 17's "intelligentiesysteem"-framing, breiden de agent-these uit naar hardware- en OS-lagen.
  • Omni Flash is alleen korte vorm. Veo 3.1 blijft de productietool voor langere, hogere-resolutie en ID-consistente video. Echte pijplijnen zullen tussen beide routeren.
  • Gespreksgebaseerde bewerking als eersteklas mogelijkheid in Omni is een workflowverschuiving die concurrenten binnen zes maanden moeten evenaren.
  • Genra integreert Omni Flash zodra API-toegang beschikbaar is, waarbij gebruikers de kwaliteitssprong op gerouteerde korte-vorm-shots stilletjes zien. Lange vorm, 4K en consistentiekritisch werk blijft op Veo en Seedance draaien.

Veelgestelde vragen

Heeft Google Veo 4 aangekondigd op I/O 2026?

Nee. Er was geen Veo 4-aankondiging. Google introduceerde in plaats daarvan de Gemini Omni-modelserie, met Omni Flash als het eerste publiek beschikbare model. De meest waarschijnlijke interpretatie is dat Google generatief videowerk consolideert onder het Omni-framework in plaats van parallelle Veo-generaties voort te zetten.

Wat is Gemini Omni?

Gemini Omni is Googles nieuwe verenigde multimodale modelserie, in staat tekst, beeld, audio en video native te genereren uit gecombineerde inputs. Omni Flash is het eerste publieke model, gericht op korte-vorm-video met gesynchroniseerde native audio en gespreksgebaseerde bewerking.

Wat is Gemini Spark?

Gemini Spark is een 24/7 cloud-residente persoonlijke AI-agent die op een dedicated Google-VM draait, integreert met Google-producten en meer dan 30 diensten van derden via MCP, en acties onderneemt namens de gebruiker — boeken, bestellen, opstellen en taakbeheer. Het wordt volgende week in bèta uitgerold naar Amerikaanse AI Ultra-abonnees.

Hoeveel kost Google AI Ultra in 2026?

Het nieuwe AI Ultra-instapabonnement is $100 per maand, verlaagd van $250. Een hoger abonnement kost $200. Het $100-abonnement omvat bètatoegang tot Gemini Spark, 5x de Gemini-app-gebruikslimiet van het Pro-abonnement, 20TB cloudopslag en YouTube Premium.

Wat is Gemini 3.5 Flash?

Gemini 3.5 Flash is Googles nieuwste fast-tier foundation-model, gelanceerd op 19 mei 2026. Google claimt dat het Gemini 3.1 Pro overtreft op coding-, agentic- en multimodale benchmarks, terwijl het draait met ongeveer 4x de outputsnelheid van vergelijkbare frontier-modellen. Beschikbaar in de Gemini-app, Search, Antigravity en de Gemini API.

Wat is Antigravity 2.0?

Antigravity is Googles platform voor agent-ontwikkeling. De 2.0-release voegt orkestratietooling toe zodat ontwikkelaars meerdere interagerende agents kunnen samenstellen, plannen en bewaken. Het richt zich op de infrastructuurlaag onder agent-producten.

Wat kondigde Google aan over smart-glasses op I/O 2026?

Google onthulde nieuwe Android XR-klasse "intelligente brillen"-apparaten, waaronder Project Aura ontwikkeld met Xreal. Er worden in het najaar van 2026 minstens drie smart-glasses-partnerschappen gelanceerd, waarmee Google zich positioneert tussen audio-first-brillen en volledige XR-headsets. Allemaal aangedreven door Gemini.

Zal Genra Gemini Omni integreren?

Ja. Genra is zo gebouwd dat het integreren van een nieuw model een backend-wijziging is in plaats van een workflowwijziging. Omni Flash wordt toegevoegd aan de routinglogica van de agent zodra het beschikbaar is via de Gemini API. Gebruikers zullen kwaliteitsverbeteringen zien op korte-vorm-output zonder hun werkwijze te veranderen.

Is Veo 3.1 nog beschikbaar na I/O 2026?

Ja. Veo 3.1 blijft beschikbaar via Google AI Studio en Vertex AI. Het blijft de productiekwaliteit-optie voor langere clips, 4K-output en use cases die karakterconsistentie via ID-embedding nodig hebben — capaciteiten die Omni Flash nog niet ondersteunt.

Wat betekent I/O 2026 voor AI-video-creators?

Drie verschuivingen. Ten eerste strekt de modelstrategie zich nu uit over Omni voor korte-vorm verenigd multimodaal en Veo 3.1 voor lange vorm en hoge resolutie — echte pijplijnen zullen tussen beide routeren. Ten tweede is agent-laag-denken nu consensus op platformniveau, niet alleen een positioneringsgok van startups. Ten derde wordt gespreksgebaseerde bewerking een basisfunctionaliteit die alle AI-video-tools zullen moeten evenaren.


Over de auteur
Chris Sherman behandelt AI-videotechnologie, agent-architecturen en de business van creatieve productie. Volg @GenraAI voor doorlopende verslaggeving over het AI-videolandschap na I/O en de MiniMax-hoorzitting (29 mei).