Gemini Omni: wat het pre-I/O-lek echt onthult
· Chris Sherman2 mei: een UI-string. 11 mei: de eerste gegenereerde clips. 19–20 mei: de aankondiging. Zes dagen voor de keynote van Google — dit is wat bekend is over Gemini Omni, en wat niet.
Een lek in twee bedrijven
Voor een model dat nog niet is aangekondigd, had Gemini Omni een ongewoon goed gedocumenteerde aanloop. Het spoor begint op 2 mei 2026, toen een X-gebruiker een UI-string ontdekte verstopt in het videogeneratie-tabblad van Gemini: «Start with an idea or try a template. Powered by Omni.» TestingCatalog schreef erover op dezelfde dag. De string bleef daar negen dagen staan terwijl iedereen speculeerde.
Daarna, op 11 mei 2026, viel de tweede schoen. Gegenereerde clips — duidelijk geproduceerd door iets anders dan het openbare Veo 3.1 — lekten uit minstens één Gemini Pro-account. Twee kregen de meeste aandacht: een spaghettiscène in een restaurant aan zee en een professor die trigonometrische bewijzen uitwerkt op een schoolbord. Beide werden binnen 24 uur opgepikt door 9to5Google, Android Authority, Chrome Unboxed en een tiental andere media.
Het volgende grote evenement is Google I/O 2026 op 19–20 mei. Wanneer u dit leest, blijven er waarschijnlijk zes dagen over. Google heeft bevestigd dat Gemini- en AI-updates op de agenda staan. Omni werd niet bij naam bevestigd.
Dit artikel is de momentopname van 13 mei — het midden van het interval. Wat is echt, wat is speculatie, wat suggereren de clips en waarop daadwerkelijk te letten wanneer de keynote begint. We updaten na I/O.
Tijdlijn in één oogopslag
| Datum | Gebeurtenis | Bronbetrouwbaarheid |
|---|---|---|
| 2 mei 2026 | UI-string «Powered by Omni» ontdekt in het Gemini-videotabblad | Hoog — screenshot circuleert |
| 2–10 mei 2026 | Speculatiefase. Geen concrete output, maar meerdere media bevestigen de string | Geverifieerd |
| 11 mei 2026 | Clips lekken uit een Gemini Pro-account — vooral de spaghettiscène en de schoolbordprofessor | Hoog — meerdere media rapporteren onafhankelijk dezelfde clips |
| 11–12 mei | Uitgebreidere UI-string verschijnt: «Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more» | Geverifieerd |
| 19–20 mei 2026 | Keynote Google I/O 2026 — waarschijnlijke officiële aankondiging | Gepland (nog niet gebeurd) |
Twee dingen vallen op. Ten eerste vond het lek in het product plaats, niet als marketingmisser — Google lijkt Omni vóór de aankondiging te zijn gaan uitrollen naar een kleine subset van Gemini Pro-gebruikers, en die uitrol was zichtbaar genoeg om een screenshot van te maken. Dat is een veel geloofwaardiger signaal dan een perslek. Ten tweede vertelt de tweede UI-string («remix your videos, edit directly in chat, try templates») u dat Google dit als workflowproduct positioneert, niet alleen als model — uitdrukkingen als «edit directly in chat» en «remix» zijn taal van consumentenproducten, niet van benchmarks.
Wat de twee clips daadwerkelijk laten zien
De twee gelekte clips zijn de meest concrete informatie die nu beschikbaar is. Beide waren kort — onder de 10 seconden — en gegenereerd uit tekstprompts in wat gebruikers omschreven als de Gemini Pro-webinterface.
Clip 1: de spaghettiscène
Een gast in een restaurant aan zee eet spaghetti, zonsonderganglicht, mediterrane omgevingsgeluiden. Het opvallende is niet de visuele getrouwheid — die concurreert met wat Veo 3.1 al doet. Het opvallende is dat de spaghetti zich gedraagt als spaghetti. Hij draait rond de vork, valt met gewicht terug en de beweging vork-naar-mond respecteert continuïteit. Voedselscènes met zware fysica waren historisch een zwak punt voor videomodellen — bestek en voedsel vervormen onnatuurlijk, slierten breken, de zwaartekracht stopt halverwege met werken. De gelekte clip handelt dit netjes af, wat suggereert dat het onderliggende model een merkbaar betere fysica-prior heeft dan het openbare Veo 3.1.
Clip 2: de schoolbordprofessor
Een professor werkt trigonometrische bewijzen uit op een schoolbord. De camera blijft op het bord terwijl hij schrijft. Het interessante hier is de tekst- en formuleweergave. AI-videomodellen zijn berucht slecht in coherente tekst — letters drijven tussen frames, vergelijkingen worden halverwege wartaal, alles wat op wiskunde lijkt valt meestal uit elkaar. De gelekte schoolbordclip toont herkenbare wiskundige notatie consistent gerenderd over frames heen, waarbij de hand van de professor de halen correct volgt. Dit is geen kleine verbetering; dit is een categorie die twee jaar lang stuk was.
Wat de twee clips samen impliceren
Als de gelekte clips representatief zijn — en dat «als» moeten we serieus nemen, want Google zou natuurlijk clips zaaien die hun beste output tonen — dan richt Omni zich op twee van de moeilijkste bekende zwaktes van AI-video: complexe fysica en tekstweergave op het scherm. Het zijn dezelfde twee punten die zowel het terugtrekken van Sora 2 als de lancering van HappyHorse 1.0 aanwezen als de volgende frontlinie. (Voor het canonieke verhaal, zie onze mid-2026-balans.)
De keuze van de demo-inhoud is belangrijk. Een spaghettiscène en een wiskundeles zijn geen esthetische demonstraties — het zijn capaciteitsdemonstraties die precies gericht zijn op de dingen die de concurrentie niet betrouwbaar kan. Dat zegt waar Google Omni tegenover positioneert.
Drie concurrerende theorieën over wat Omni werkelijk is
Hier leeft de pre-I/O-speculatie. Er zijn drie aannemelijke interpretaties van wat Omni vertegenwoordigt, en ze hebben zeer verschillende implicaties voor de rest van de markt.
Theorie 1: een consumenten-rebranding van Veo 3.1
De eenvoudigste interpretatie: Omni is slechts een nieuwe publieke naam voor de bestaande Veo-pipeline binnen de consumenten-Gemini-app. De onderliggende generatiestack verandert niet. Google trekt het merk «Veo» terug van het consumentenoppervlak, behoudt het voor de Vertex AI-bedrijfs-API en geeft de Gemini-chatervaring een verenigde productnaam.
Voor: Google heeft een geschiedenis van hernoemingen. Bard → Gemini was het meest zichtbare voorbeeld. De consumentenbranding rond «Veo 3.1» was altijd onhandig — versienummers verkopen niet aan niet-technische gebruikers. De UI-strings («remix your videos, edit directly in chat») benadrukken workflow, geen modelvernieuwing.
Tegen: De gelekte clips tonen capaciteit die het openbare Veo 3.1 zichtbaar overstijgt, vooral in fysica en tekstweergave. Een pure rebranding zou geen zichtbaar andere output produceren. Tenzij Google stilletjes een Veo 3.2 uitlevert onder het Omni-merk, verklaart deze theorie de clips niet.
Theorie 2: een apart, in Gemini getraind videomodel
De middentinterpretatie: Omni is een nieuw videomodel getraind binnen de Gemini-lijn — apart van DeepMind's Veo-pipeline — en staat naast Veo in Google's roadmap in plaats van het te vervangen. Consumenten-Gemini gebruikt Omni; zakelijke klanten op Vertex AI blijven Veo gebruiken. Beide evolueren parallel.
Voor: Google heeft historisch parallelle modellijnen aangehouden (Gemini voor consumenten, aparte onderzoekslijnen voor zakelijk). De capaciteitssprong in de gelekte clips is consistent met een model getraind op een andere datamix en architectuur dan Veo 3.1.
Tegen: Twee toptier-videomodellijnen draaien is duur. Het terugtrekken van Sora 2, behandeld in onze post-mortem, liet zien dat zelfs OpenAI één consumenten-videomodel op schaal niet kon volhouden; er twee runnen zou een vreemde strategische keuze zijn voor Google.
Theorie 3: een verenigd Omni-model (beeld + video + audio in één forward pass)
De meest ambitieuze interpretatie: Omni is het eerste lid van een nieuwe modelfamilie getraind in Gemini die beeldgeneratie, videogeneratie en gesynchroniseerde audio in één forward pass behandelt. Dit is de architectuur die HappyHorse 1.0 inluidde toen het in april Arena #1 pakte met een verenigd audio-videomodel van 15B parameters. Onder deze theorie vervangt Omni zowel de huidige Veo-pipeline (video) als de Nano Banana Pro-stack (beeld) door één multimodale generator.
Voor: De productnaam zelf — «Omni» — impliceert sterk multimodale reikwijdte. De UI-framing («our new video model, remix your videos, edit directly in chat») suggereert één productoppervlak dat meerdere modaliteiten dekt. De concurrentiedruk vanuit HappyHorse om een verenigde architectuur te leveren is acuut; Google verliest de Arena-top sinds april. (Architectuurdetails in onze HappyHorse 1.0-recensie.)
Tegen: Verenigde Omni-modellen zijn technisch moeilijk, en Google is voorzichtiger dan ByteDance of Alibaba in het naar consumenten brengen van nieuwe architecturen. Twee productiepipelines gelijktijdig vervangen is een hoog-risicozet voor een publieke keynote.
Waar het geld zit
Sectorwatchers verdelen zich grofweg 30/30/40 over de drie theorieën. De meest waarschijnlijke lezing, op basis van UI-framing en capaciteitssprong, is een hybride tussen Theorie 2 en 3: een nieuw in Gemini getraind model dat minstens video en audio verenigd behandelt, met Veo levend op Vertex AI voor zakelijke klanten die stabiliteit nodig hebben. Over zes dagen weten we het.
Waarom dit voorbij Google belangrijk is
Omni is niet interessant omdat Google een nieuw videomodel uitbrengt. Nieuwe videomodellen verschijnen nu maandelijks. Omni is interessant vanwege wat het zou betekenen als Theorie 3 klopt.
De AI-videosector bracht de eerste vier maanden van 2026 door met kijken hoe de verenigde Omni-modelthese zich ontvouwt. Sora 2 stortte in 84 dagen ineen met aparte-pipelinesarchitectuur. HappyHorse 1.0 pakte Arena #1 in 48 uur met een verenigde architectuur van 15B parameters. Seedance 2.0 levert audio en video samen via een dual-branch transformer. Het technische zwaartepunt verschoof naar verenigde modellen gedurende een heel kwartaal, en het enige grote westerse lab dat niet had gereageerd was Google.
Als Omni een echt verenigd model is — Theorie 3 — dan loopt Google mee met de architectuurtrend gevestigd door de Chinese koplopers. Dat heeft drie afgeleide effecten:
- Het Veo-merk consolideert of treedt terug. Een Veo met aparte pipelines naast een verenigd Omni langer dan 12 maanden draaien slaat nergens op. Zakelijke klanten op Vertex AI zouden een migratieroute verwachten.
- De westerse/Chinese architectuurkloof sluit zich. Het kader «Chinese modellen hebben een structurele voorsprong omdat ze verenigde architecturen pioneerden» verzwakt zodra Google de zijne levert.
- De differentiatie op modelniveau blijft samentrekken. Als vier van de zes topmodellen verenigde audio-videoarchitecturen gebruiken, commodifieert de modellaag verder en wordt de agentlaag het enige zinvolle differentiatiepunt. Dit is de centrale stelling van onze mid-2026-balans, en Omni zou hem uitbreiden.
Als Omni slechts een rebranding is (Theorie 1), is het meeste hiervan niet van toepassing. Maar de gelekte clips maken Theorie 1 de minst waarschijnlijke van de drie.
Waarop te letten bij I/O — checklist van zes punten
Als de keynote op 19 mei begint, vertellen deze signalen welke theorie klopte. Geen enkel signaal is op zichzelf definitief, maar samen vormen ze een helder beeld.
Signaal 1: Zegt Google nog steeds «Veo» op het keynote-podium?
Als Veo opvallend afwezig is in het op consument gerichte Gemini-segment, is dat bewijs dat Veo als consumentenmerk wordt teruggetrokken. Als Veo nog naast Omni wordt genoemd, bestaan ze naast elkaar (Theorie 2). Worden beide genoemd maar wordt Veo alleen voor zakelijk gepositioneerd, dan begint de migratie.
Signaal 2: Genereert Omni audio in dezelfde call als video?
Eén API-call die gesynchroniseerd video + audio teruggeeft is het technische handtekenend van een verenigd Omni-model (Theorie 3). Twee aparte API-calls — eerst video, dan een tweede call voor audiosynthese — is het oudere architecturale patroon. De keynote-demo zal dit waarschijnlijk duidelijk tonen.
Signaal 3: Behandelt Omni ook beeldgeneratie?
Als Omni alleen als het nieuwe videomodel wordt gepositioneerd, is de reikwijdte smaller. Als Omni beeldgeneratie absorbeert — Nano Banana Pro binnen het Gemini-chatoppervlak vervangt — is dat bewijs voor de bredere multimodaliteitsstelling. Let op of beeldgeneratiedemo's in de keynote aan «Omni» worden toegeschreven of als Nano Banana / Imagen blijven.
Signaal 4: Is er een API op dag één?
Veo 3.1 lanceerde op Vertex AI op dag één van zijn keynote. Verschijnt Omni met openbare API-toegang en prijzen op 19–20 mei, dan is het meteen gepositioneerd voor productiegebruik. Komt het alleen voor consumenten met API-toegang «later dit jaar», dan volgt Google de retail-first-route van Sora 2 — en we hebben al gezien dat dat economisch op schaal niet werkt.
Signaal 5: Hoe ziet de prijsstructuur eruit?
De huidige openbare top-tier API-prijsbenchmark loopt grofweg van $0,05/sec (HappyHorse 1.0) tot $0,50/sec (Veo 3.1). Ligt de API-prijs van Omni dichter bij HappyHorse, dan concurreert Google op kosten; dichter bij Veo 3.1, op kwaliteit. De keuze vertelt welke markt Google prioriteert.
Signaal 6: Hoe past Project Astra erin?
Google demonstreert Project Astra — zijn realtime multimodale assistent — sinds 2024 op elke I/O. Wordt Astra plots een product op 19–20 mei en gebruikt het Omni eronder, dan is dat de bredere «omni»-stelling: niet zomaar een videomodel maar een realtime multimodaal AI-oppervlak door de hele Gemini-ervaring heen.
Wat dit betekent voor uw workflow
Drie praktische punten in afwachting van de keynote.
Als u maker bent en Gemini direct gebruikt
Verander voorlopig niets. Omni in de consumenten-Gemini-app, mocht het volgende week komen, zal de bestaande videogeneratie-ervaring eenvoudigweg vervangen of upgraden. De formulering «remix your videos, edit directly in chat» wijst op dezelfde chatgedreven workflow die u al kent, met een slimmer model eronder. Wacht op de aankondiging, probeer de nieuwe mogelijkheden uit en pas uw prompts aan op wat werkelijk verandert.
Als u op Vertex AI bouwt
Houd Signaal 1 (Veo-merk) en Signaal 4 (API-beschikbaarheid) nauwgezet in de gaten. Wordt Veo als consumentenmerk teruggetrokken maar blijft het op Vertex AI voor zakelijk, dan is uw bestaande integratie veilig. Vervangt Omni Veo volledig op Vertex AI, dan staat u een API-migratie te wachten. In beide gevallen: bouw uw integratie door een agent- of orkestratielaag heen zodat een modelwissel een configuratiewijziging is en geen codewijziging.
Als u een multi-model agent-stack draait
Dit is de situatie die we in onze recente stukken bepleitten. (Zie de zes verschuivingen en de knelpunten van lang formaat.) Een multi-model agent behandelt Omni als nóg een generator om naartoe te routeren — naast Veo, Seedance, HappyHorse, Kling, Luma en Runway. De agentlaag is waar de productieve vraag leeft: welke shot in deze 60 seconden video gaat naar welk model. De aankondiging van Omni voegt een optie toe aan de routingtabel; het verandert de architectuur die u draait niet.
Dit is precies waarom we de Genra-stack modelagnostisch hielden: de modellaag blijft bewegen, de agentlaag is wat zich opstapelt.
Slotsom, zes dagen voor I/O
Wat we weten: er zit een echt model genaamd Omni in het Gemini-videotabblad, het produceert output die zichtbaar beter is dan het openbare Veo 3.1 op fysica en tekst, en Google framet het als chat-gebaseerd workflowproduct. Wat we niet weten: of het een rebranding is, een parallel nieuw model, of een verenigd Omni-modaliteitssysteem.
De nuttigste enkele voorspelling is de derde. Klopt Theorie 3, dan sluit de westerse/Chinese architectuurkloof zich op 19 mei, en keert de sector terug naar een multipolaire race waarin alle grote labs verenigde audio-videoarchitecturen draaien. Klopt Theorie 3 niet, dan blijft Google achter op het architecturale front dat HappyHorse heeft gezet — en blijft het concurrentiebeeld zoals na de HappyHorse-launch van april.
In beide gevallen is de praktische conclusie dezelfde: de modellaag blijft bewegen, de agentlaag is waar u zou moeten bouwen. Omni verandert dat niet. Het versterkt het (door nog een commoditymodel toe te voegen aan de routingtabel), of beweegt de naald niet (als het een rebranding is). Teams die hun differentiatie al naar agentinfrastructuur hebben verplaatst, zullen wat Google op de 19e ook aankondigt opnemen als configuratie-update. Teams die nog gokken op één heldenmodel zullen de rest van Q2 besteden aan napassen.
We updaten dit stuk na de keynote met wat werkelijk wordt aangekondigd.
FAQ
Wat is Gemini Omni?
Gemini Omni is een onaangekondigd AI-videogeneratiemodel dat via twee lekken in Google's Gemini-interface opdook — een UI-string gespot op 2 mei 2026 en gegenereerde videoclips gelekt uit een Gemini Pro-account op 11 mei. Google heeft Omni per 13 mei niet officieel bevestigd. Het meest waarschijnlijke aankondigingsvenster is Google I/O 2026 op 19–20 mei.
Vervangt Gemini Omni Veo?
Niet bevestigd. Drie theorieën zijn in het spel: Omni is een consumenten-rebranding van Veo 3.1, Omni is een apart in Gemini getraind nieuw model dat naast Veo bestaat, of Omni is een verenigd Omni-modaliteitsmodel dat zowel Veo als de beeldgeneratiestack vervangt. De gelekte clips suggereren capaciteit die het huidige openbare Veo 3.1 overstijgt, wat de pure rebrandingtheorie het minst waarschijnlijk maakt.
Wat lieten de gelekte clips zien?
Twee clips kregen de meeste aandacht: een spaghettiscène in een strandrestaurant (opvallend door het hanteren van voedselbeweging met zware fysica) en een professor die trigonometrische bewijzen uitwerkt op een schoolbord (opvallend door coherente weergave van wiskundige notatie over frames heen). Beide zijn algemeen erkende zwakke gebieden voor videomodellen.
Wanneer weten we wat Omni echt is?
Google I/O 2026 op 19–20 mei. Let op zes signalen: wordt Veo nog genoemd, wordt audio gegenereerd in dezelfde call als video, is beeldgeneratie inbegrepen, is er een API op dag één, wat is de prijs en hoe past Project Astra erin.
Wat moet ik als maker doen vóór de aankondiging?
Verander voorlopig niets. Gebruikt u consumenten-Gemini, wacht dan op de lancering. Bent u op Vertex AI, let dan op de API-migratieroute. Draait u een multi-model agent-stack, behandel Omni dan als nog een generator om naartoe te routeren.
Hoe verhoudt Omni zich tot HappyHorse 1.0?
HappyHorse 1.0 pakte Artificial Analysis Video Arena #1 in 48 uur nadat het op 7 april 2026 werd gelanceerd, met een verenigde audio-videoarchitectuur van 15B parameters. Is Omni ook een verenigd Omni-model, dan vertegenwoordigt het Google's eerste antwoord op die architecturale richting.
Over de auteur
Chris Sherman schrijft over AI-videotechnologie en creatieve productieworkflows. Volg @GenraAI voor live verslag tijdens de Google I/O 2026-keynote op 19–20 mei.