Robin Li 'model çağı bitti' dedi — AI video bunu aylardır sessizce kanıtlıyor
· Chris ShermanBaidu CEO'su bugün Pekin'de Create 2026'yı «hangi model en iyi?» sorusunu önemli sorulardan emekliye ayırarak açtı. AI video için bu, dört ay öncesinden başlayan bir konsensüsü resmileştirdi.
Sektörü yeniden çerçeveleyen cümle
Baidu'nun kurucu ortağı ve CEO'su Robin Li, 14 Mayıs 2026'da Pekin'deki Baidu Create 2026 sahnesinde, yılın geri kalanında alıntılanacak bir cümle bıraktı: AI sektörü, dedi, «model rekabeti»ni geride bırakıp «agent çağı»na girdi. Bunu somut bir teklifle eşleştirdi — yeni sektör metriği Daily Active Agents (DAA) olmalı, mobil internetin DAU'sunun agent çağı eşdeğeri, küresel DAA'nın sonunda 10 milyarı aşacağı projeksiyonuyla.
Son dört aydır AI video pazarını izliyorsanız, bunların hiçbiri tahmin değil. Tariftir.
Sora 2, sadece-model stratejisinin ağırlığı altında 84 günde çöktü. HappyHorse 1.0, Arena #1'i 48 saatte aldı ve frontier video modelleri arasındaki anlamlı teknik açığı anında neredeyse sıfıra sıkıştırdı. Seedance 2.0, Veo 3.1 ve sızdırılan Gemini Omni hepsi aynı mimari varış noktasında birleşiyor. «Hangi model en iyi?» sorusu Şubat ile Nisan arasında bir noktada ilginç olmaktan çıktı. Bugün, Robin Li bunu yüksek sesle söyleyen ilk büyük platform CEO'su oldu.
Bu yazı bunun AI video için özellikle ne anlama geldiğini ele alıyor — Li ne dedi, Baidu bugün gerçekte ne sevkiyat yaptı ve Pekin'deki uygulama katmanı keynote'unun 2026'nın ikinci yarısı için rekabet manzarasının sahip olduğumuz en doğru tarifi olduğu nasıl ortaya çıkıyor.
Li'nin Gerçekte Söyledikleri
1. «AI evrim teorisi» — üç katmanlı dönüşüm
Li, «AI evrim teorisi» dediği şeyi ortaya koydu: üç katmanda eşzamanlı dönüşüm. Agent'ler pasif yanıtlayıcılardan, ortamdan sürekli öğrenen otonom uygulayıcılara evriliyor. Bireyler sıradan kullanıcılardan, AI ile birlikte yaşayıp kendi çıktısını çoğaltan «süper bireylere» evriliyor. İşletmeler insan-insan işbirliğinden, birleşik süper-organizasyonlar olarak işleyen karma insan-agent oluşumlarına evriliyor.
Retoriği soyduğunuzda öz açık: değer göçü ham model yeteneğinden uzaklaşıp, yeteneği sonuçlara orkestre eden katmana doğru ilerliyor. Bu agent katmanıdır.
2. Daily Active Agents (DAA) — yeni bir metrik
Li, DAA'yı DAU'nun agent çağı halefi olarak önerdi. Argüman: token'lar maliyeti ölçer, değeri değil — girdi metriği, çıktı değil. Aktif agent'ler ise otonom yazılımın birinin adına ne sıklıkla gerçekten faydalı iş yaptığını ölçer. Küresel DAA'nın sonunda 10 milyarı aşabileceğini öngördü.
3. «Tek kullanımlık yazılım» — atılabilir eserler olarak uygulamalar
Üçüncü iplik: kod üretim maliyetleri çökerken, yazılım geliştirme bariyerleri düşer ve tek kullanımlık uygulamalar uygulanabilir hale gelir. Kullanıcılar tek görev için özel yazılım üretip atar. Li, Baidu'nun kodlama agent'i Miaoda'yı işleyen örnek olarak gösterdi — kendi kodunun yaklaşık %90'ını ürettiği bildiriliyor.
Baidu bugün gerçekte ne sevkiyat yaptı
| Ürün | Ne | Neden önemli |
|---|---|---|
| DuMate | Genel amaçlı agent — Baidu'nun amiral gemisi yatay agent ürünü | OpenAI'nin Operator/ChatGPT-as-agent konumlandırmasına doğrudan atış |
| Miaoda (app + kurumsal) | Kendi kodunun ~%90'ını üreten kodlama agent'i | «Tek kullanımlık yazılım» tezinin somutlaştırılması |
| Baidu YiJing (güncellenmiş) | Canlı yayın ve gerçek zamanlı video üretimi için çok agent'li dijital insan platformu | AI video yaratıcıları için en doğrudan ilgili lansman |
| Famou Agent 2.0 | Kendini geliştiren agent platformu | Sürekli öğrenme otonomisi uzun vadeli DAA hamlesi |
Bizim konumuz için ilginç olan YiJing. Çok agent'li dijital insan platformu — yani sistem üzerine sohbet arayüzü yapıştırılmış tek bir video modeli değil. Canlı yayın ve gerçek zamanlı üretim için birden fazla uzman agent'i koordine eden bir orkestrasyon katmanı: senaryo için bir agent, sunum ve dudak senkronu için bir agent, kamera ve çekim seçimi için bir agent, izleyici tepkisi için bir agent, ürün/promo mantığı için bir agent. Video modeli aşağıda bir yerde, değiştirilebilir bileşen olarak.
Neden şimdi, altı ay önce değil
- Sora 2'nin ekonomik çöküşü. OpenAI'nin amiral tüketici video modeli 84 günde kapandı. Post-mortem.
- HappyHorse 1.0'ın anında yükselişi. Alibaba'nın birleşik ses-video modeli 48 saatte Arena #1. İnceleme.
- Mimari yakınsama. Seedance 2.0, HappyHorse 1.0 ve sızdırılan Gemini Omni aynı varış noktasını gösteriyor.
- Fiyat sıkışması. Üst düzey video API fiyatları $0.50/sn (Veo 3.1)'den $0.05/sn (HappyHorse 1.0)'a düştü.
Li değişimi öngörmedi. Adlandırdı.
Agent çağı AI video için ne anlama geliyor
1. «Hangi modeli kullanmalıyım?» sorusu artık geçersiz
Doğru soru «agent yığınım her çekimde işi en iyi modele nasıl yönlendiriyor?». Veo 3.1 yüksek fizikli hareket için en iyi olabilir. HappyHorse 1.0 senkronize konuşma için. Seedance 2.0 çoklu çekim dizileri için. Kling 3.0 stilize estetik için. Agent'in işi hangisinin hangisi olduğunu bilmek ve otomatik yönlendirmek.
2. Çıktı kalitesi artık model yeteneğiyle ilgili değil
Prompt çeviri kalitesi, çekim ayrıştırma, çekimler arası süreklilik yönetimi, ses-video senkron doğrulaması ile ilgili oluyor — modelin kendi başına iyi yapamadığı şeyler.
3. Farklılaşma birimi «model»den «iş akışı»na geçiyor
Eğer bir araçsanız, «Veo 3.1 kullanıyoruz» ile yarışmıyorsunuz. Agent'inizin Veo 3.1, Seedance 2.0, HappyHorse, Kling, Luma ve Runway üzerinde ne yaptığıyla yarışıyorsunuz. Yıl ortası 2026 değerlendirmesinin merkezi tezi.
4. DAA, yaratıcı araçları için başarı metriğini yeniden çerçeveliyor
DAU için optimize edilmiş araçlar kullanıcıyı kurcalamaya iter. DAA için optimize edilmiş araçlar devretmeye iter — daha az etkileşim, daha yüksek otonomi, oturum başına daha fazla iş.
5. «Atılabilir agent'ler» yaratıcı işin birimi haline geliyor
Kalıcı ayarlarla daimi araç yerine, her projenin kendine özgü agent'i vardır — brief için derlenir, kısıtlama için optimize edilir, teslimde dağılır.
Bu sizin için özellikle ne anlama geliyor
Bireysel yaratıcıysanız
Model benchmark'ını bırakın. İş akışı benchmark'ına başlayın. Önümüzdeki 60 günün en kullanışlı sorusu «HappyHorse benim işim için Veo'dan daha mı iyi?» değil — «şu anki aracım modeller arasında akıllıca yönlendiriyor mu yoksa ben elle mi yapıyorum?».
Bir video ürünü inşa ediyorsanız
Model entegrasyonlarınıza yapılandırma muamelesi yapın, kod değil. Yayın temposu, belirli bir modele sabit kodlamanın altı aylık bir saatli bomba olduğunu garanti eder.
Kurumsal bir yaratıcı ekibi yönetiyorsanız
Li'nin «karma insan-agent oluşumları» bir slogan değil. Somut bir operasyonel hedef.
Buradan izlenecek üç sinyal
Sinyal 1: Google I/O 2026 (19–20 Mayıs)
Eğer Gemini Omni agent-yerel arayüzlü birleşik omni-modaliteli model olarak çıkarsa, Google örtük olarak aynı tezi onaylar.
Sinyal 2: Hailuo/MiniMax duruşması (29 Mayıs)
Disney, Warner Bros. ve NBCUniversal'a karşı MiniMax 29 Mayıs'ta Yargıç Blumenfeld önünde.
Sinyal 3: Büyük platformlardan DAA benimsenmesi
OpenAI, Anthropic, Meta veya Google'ın bir sonraki çeyrek açıklamalarında DAA (veya eşdeğer otonomi metriği) benimseyip benimsemediğini izleyin.
Sonuç
Li'nin 14 Mayıs keynote'unun en faydalı yanı yeni ürün duyurması değil — DuMate, Miaoda ve YiJing zaten orada olan bir desene Baidu şeklinde yanıtlar. En faydalı yanı, AI video pazarında dört aydır sessizce yaşanan bir kaymaya isim ve metrik vermesi.
Model katmanı hareket etmeye devam ediyor. Edecek. Gemini Omni gelecek hafta, Seedance 3 Q3'te, Anthropic ve Meta'nın yıl sonuna kadar gönderdiği her şey. Hiçbiri yerleşmeyecek. Tam da bu nokta. Model katmanı kalıcı harekette olduğunda, inşa etmek için tek dayanıklı yer bir kat yukarı — agent katmanı, iş akışlarının birikip orkestrasyonun kullanımla iyileştiği yer.
AI video için bu spekülasyon değil. 2026'nın başından beri bu tezle çalışıyoruz, bu yüzden Genra tek bir modelin ön ucu olarak değil, Veo + Seedance üzerinde uçtan uca agent olarak inşa edildi. Agent'in işi doğru modele yönlendirmek, çekimler arası sürekliliği yönetmek, ses ve hareketi senkronize etmek ve sizi yönlendirme motoru yapmadan son kurguyu teslim etmek. Li'nin keynote'u bu yıl aldığımız bu mimari seçim için en açık kamuya açık onaydır.
Google I/O'ya beş gün. MiniMax duruşmasına on beş. Önümüzdeki iki hafta sektörün ne kadarının Li'nin bugün Pekin'de söylediklerine katıldığını söyleyecek.
SSS
Baidu Create 2026 nedir?
Baidu'nun yıllık AI geliştirici konferansı, 13-14 Mayıs 2026 Pekin'de. CEO Robin Li, 14 Mayıs keynote'unu agent çağını ilan etmek ve DAA'yı yeni tanımlayıcı metrik olarak önermek için kullandı.
Robin Li tam olarak neyi duyurdu?
Dört ürün: DuMate (genel agent), Miaoda app + kurumsal (~%90 öz-kod), güncellenmiş Baidu YiJing ve Famou Agent 2.0. Ayrıca DAA metriği ve üç katmanlı AI evrim teorisi.
Daily Active Agents (DAA) nedir?
DAU'nun agent çağı karşılığı. Otonom agent'lerin günlük faydalı iş yapma sayısını ölçer. Li küresel 10 milyar üzerini öngörüyor.
AI video için neden önemli?
AI video tezi dört ayda ampirik olarak kanıtladı.
«Tek kullanımlık yazılım» videoya nasıl uygulanır?
Video için: kalıcı araçlar yerine projeye özel agent toplulukları.
Yaratıcı olarak ne yapmalıyım?
Modelleri tek başına benchmark etmeyi bırakın. İş akışlarını benchmark etmeye başlayın.
Yazar hakkında
Chris Sherman AI video teknolojisi ve yaratıcı üretim iş akışlarını yazıyor. Google I/O 2026 (19-20 Mayıs) ve MiniMax duruşması (29 Mayıs) için canlı yayın @GenraAI'da.