Robin Li verklaart modeltijdperk voorbij — AI-video bewijst dat al maanden
· Chris ShermanBaidu's CEO opende Create 2026 in Beijing vandaag door «welk model is het beste?» als doorslaggevende vraag terzijde te schuiven. Voor AI-video maakte dit slechts een vier maanden oude consensus officieel.
De zin die de industrie herkadrede
Robin Li, medeoprichter en CEO van Baidu, betrad op 14 mei 2026 het podium van Baidu Create 2026 in Beijing en leverde een zin die de rest van het jaar geciteerd zal worden: de AI-industrie, zei hij, is voorbij «modelconcurrentie» gegaan en in «het agent-tijdperk» beland. Hij koppelde dit aan een concreet voorstel — de nieuwe industriemetriek moet Daily Active Agents (DAA) zijn, de agent-tijdperk-equivalent van mobiele internet-DAU, met een wereldwijde DAA-projectie van uiteindelijk meer dan 10 miljard.
Als je de AI-videomarkt de afgelopen vier maanden gevolgd hebt, is niets hiervan een voorspelling. Het is een beschrijving.
Sora 2 stortte in 84 dagen ineen onder het gewicht van een alleen-model-strategie. HappyHorse 1.0 pakte Arena #1 in 48 uur en comprimeerde het zinvolle technische gat tussen frontier-videomodellen onmiddellijk tot vrijwel nul. Seedance 2.0, Veo 3.1 en het gelekte Gemini Omni convergeren allemaal op hetzelfde architecturale eindpunt. De vraag «welk model is het beste?» hield op interessant te zijn ergens tussen februari en april. Vandaag werd Robin Li de eerste CEO van een groot platform die het hardop uitsprak.
Dit stuk gaat over wat dat specifiek voor AI-video betekent — wat Li zei, wat Baidu vandaag daadwerkelijk leverde en waarom een keynote over de applicatielaag in Beijing de meest accurate beschrijving blijkt te zijn van het concurrentielandschap voor de tweede helft van 2026.
Wat Li daadwerkelijk zei
1. De «AI-evolutietheorie» — een drielagige verschuiving
Li zette uiteen wat hij «AI-evolutietheorie» noemde: gelijktijdige transformatie op drie lagen. Agents evolueren van passieve responders tot autonome uitvoerders die voortdurend leren van hun omgeving. Individuen evolueren van gewone gebruikers tot «superindividuen» die met AI coëxisteren om hun output te vermenigvuldigen. Ondernemingen evolueren van mens-mens-samenwerking tot gemengde mens-agent-formaties die opereren als verenigde superorganisaties.
Strip de retorische verpakking en de kern is helder: waardemigratie verplaatst zich weg van ruwe modelcapaciteit naar de laag die capaciteit orkestreert tot uitkomsten. Dat is de agent-laag.
2. Daily Active Agents (DAA) — een nieuwe metriek
Li stelde DAA voor als agent-tijdperk-opvolger van DAU. Het argument: tokens meten kosten, geen waarde — een input-, geen output-metriek. Actieve agents daarentegen meten hoe vaak autonome software namens iemand daadwerkelijk nuttig werk verricht. Hij projecteerde dat wereldwijde DAA uiteindelijk 10 miljard kon overstijgen.
3. «Wegwerpsoftware» — applicaties als wegwerpartefacten
De derde draad: terwijl codegeneratiekosten instorten, vallen softwareontwikkelingsbarrières en worden eenmalige of «wegwerp»-applicaties haalbaar. Gebruikers genereren maatwerksoftware voor één taak en gooien die weg. Li noemde Baidu's coding-agent Miaoda — die naar verluidt ongeveer 90 % van zijn eigen code genereert — als werkend voorbeeld.
Wat Baidu vandaag daadwerkelijk leverde
| Product | Wat het is | Waarom het ertoe doet |
|---|---|---|
| DuMate | Algemene agent — Baidu's vlaggenschip-horizontaal agent-product | Directe treffer op OpenAI's Operator/ChatGPT-as-agent-positionering |
| Miaoda (app + enterprise) | Coding-agent die ~90 % van zijn eigen code genereert | De «wegwerpsoftware»-these concreet gemaakt |
| Baidu YiJing (bijgewerkt) | Multi-agent digitale-mens-platform voor livestreaming en realtime videogeneratie | Meest direct relevante launch voor AI-videocreators |
| Famou Agent 2.0 | Zelfontwikkelend agent-platform | Continu-lerende autonomie is de DAA-zet voor de lange termijn |
Het interessante voor ons onderwerp is YiJing. Een multi-agent digitale-mens-platform — wat betekent dat het systeem niet één videomodel is met een chatinterface erop geplakt, maar een orkestratielaag die meerdere gespecialiseerde agents coördineert voor livestreaming en realtime-generatie: één agent voor script, één voor afgifte en lipsynchronisatie, één voor camera en shotkeuze, één voor publieksreactie, één voor product/promo-logica. Het videomodel zit ergens daaronder, behandeld als verwisselbare component.
Waarom nu, niet zes maanden geleden
- Sora 2's economische instorting. OpenAI's vlaggenschip-consumentenvideomodel sloot in 84 dagen. Post-mortem.
- HappyHorse 1.0's onmiddellijke opkomst. Alibaba's unified audio-videomodel pakte Arena #1 in 48 uur. Review.
- Architecturale convergentie. Seedance 2.0, HappyHorse 1.0 en gelekte Gemini Omni wijzen allen naar dezelfde bestemming.
- Prijscompressie. Top-tier video-API-prijzen daalden van $0,50/sec (Veo 3.1) naar $0,05/sec (HappyHorse 1.0).
Li voorspelde de verschuiving niet. Hij benoemde haar.
Wat het agent-tijdperk concreet betekent voor AI-video
1. De vraag «welk model moet ik gebruiken?» is nu obsoleet
De juiste vraag is «welke agent-stack routeert mijn werk naar het beste model voor elke shot?». Veo 3.1 kan het beste zijn voor high-physics-beweging. HappyHorse 1.0 voor gesynchroniseerde spraak. Seedance 2.0 voor multi-shot-sequenties. Kling 3.0 voor gestileerde esthetiek.
2. Outputkwaliteit hangt niet langer af van modelcapaciteit
Ze hangt af van prompt-vertaalkwaliteit, shot-decompositie, continuïteitsmanagement, audio-video-sync-verificatie — dingen die het model zelf niet goed doet.
3. De differentiatie-eenheid verschuift van «model» naar «workflow»
Als je een tool bent, concurreer je niet op «we gebruiken Veo 3.1». Je concurreert op wat je agent doet bovenop Veo 3.1, Seedance 2.0, HappyHorse, Kling, Luma en Runway samen. Centrale these van onze mid-2026-balans.
4. DAA herkadred de succesmetriek voor creator-tools
Tools die op DAU optimaliseren duwen de gebruiker tot prutsen. Tools die op DAA optimaliseren duwen tot delegeren — minder interacties, hogere autonomie, meer werk per sessie.
5. «Wegwerp-agents» worden de eenheid van creatief werk
In plaats van een permanente tool met persistente instellingen, krijgt elk project zijn eigen op maat gemaakte agent — geassembleerd voor de briefing, geoptimaliseerd voor de constraint, opgelost bij oplevering.
Wat dit specifiek voor jou betekent
Als je individuele creator bent
Stop met benchmarken van modellen. Begin met benchmarken van workflows. De nuttigste vraag van de komende 60 dagen is niet «is HappyHorse beter dan Veo voor mijn werk?» — maar «routeert mijn huidige tool intelligent tussen modellen, of doe ik het routing handmatig?».
Als je een videoproduct bouwt
Behandel je model-integraties als configuratie, niet als code. Het release-tempo garandeert dat hardcoderen op een specifiek model een tijdbom van zes maanden is.
Als je een enterprise-creatief team leidt
Li's «gemengde mens-agent-formaties» is geen slogan. Het is een concreet operationeel doel.
Drie signalen om vanaf hier in de gaten te houden
Signaal 1: Google I/O 2026 (19–20 mei)
Als Gemini Omni uitgeleverd wordt als unified omni-modaliteits-model met agent-native interface, dan onderschrijft Google impliciet dezelfde these.
Signaal 2: De Hailuo/MiniMax-hoorzitting (29 mei)
Disney, Warner Bros. en NBCUniversal tegen MiniMax voor rechter Blumenfeld op 29 mei.
Signaal 3: DAA-adoptie door grote platforms
Let op of OpenAI, Anthropic, Meta of Google DAA (of een gelijkwaardige autonomie-metriek) overnemen in hun volgende kwartaaldisclosure.
Slotsom
Het nuttigste aan Li's keynote van 14 mei is niet dat hij nieuwe producten aankondigde — DuMate, Miaoda en YiJing zijn Baidu-vormige antwoorden op een patroon dat er al was. Het nuttigste is dat hij naam en metriek gaf aan een verschuiving die al vier maanden stilletjes plaatsvond op de AI-videomarkt.
De modellaag blijft bewegen. Hij zal blijven bewegen. Gemini Omni volgende week, Seedance 3 in Q3, wat Anthropic en Meta ook leveren voor het einde van het jaar. Niets gaat zich vestigen. Dat is precies het punt. Wanneer de modellaag in permanente beweging is, is de enige duurzame plek om te bouwen één laag erboven — bij de agent-laag, waar workflows accumuleren en orkestratie verbetert met gebruik.
Voor AI-video is dit geen speculatie. We opereren op deze these sinds begin 2026, en daarom is Genra gebouwd als end-to-end agent bovenop Veo + Seedance in plaats van als frontend voor een enkel model. De taak van de agent is naar het juiste model routen, continuïteit over shots beheren, audio en beweging synchroniseren en de eindcut leveren zonder dat jij de routing-engine bent. Li's keynote is de meest expliciete publieke onderschrijving van die architectuurkeuze die we dit jaar gekregen hebben.
Vijf dagen tot Google I/O. Vijftien tot de MiniMax-hoorzitting. De komende twee weken zullen je vertellen hoeveel van de industrie het eens is met wat Li vandaag in Beijing zei.
FAQ
Wat is Baidu Create 2026?
Baidu's jaarlijkse AI-ontwikkelaarsconferentie, 13–14 mei 2026 in Beijing. CEO Robin Li gebruikte de keynote van 14 mei om het agent-tijdperk uit te roepen en DAA voor te stellen als nieuwe definiërende metriek.
Wat kondigde Robin Li precies aan?
Vier producten: DuMate (algemene agent), Miaoda app + enterprise (~90 % zelfgegenereerde code), bijgewerkte Baidu YiJing en Famou Agent 2.0. Plus de DAA-metriek en een drielagige AI-evolutietheorie.
Wat zijn Daily Active Agents (DAA)?
Agent-tijdperk-equivalent van DAU. Meet hoeveel autonome agents per dag nuttig werk verrichten. Li projecteert wereldwijd > 10 miljard.
Waarom doet het er specifiek toe voor AI-video?
AI-video heeft de these in vier maanden empirisch bewezen.
Wat is «wegwerpsoftware» toegepast op video?
Voor video: projectspecifieke agent-ensembles in plaats van permanente tools.
Wat moet ik als creator doen?
Stop met geïsoleerd benchmarken van modellen. Begin met benchmarken van workflows.
Over de auteur
Chris Sherman schrijft over AI-videotechnologie en creatieve productieworkflows. Volg @GenraAI voor live verslag van Google I/O 2026 (19–20 mei) en de MiniMax-hoorzitting (29 mei).