Gemini Omni: I/O öncesi sızıntı aslında ne anlatıyor
· Chris Sherman2 Mayıs: bir UI dizgisi. 11 Mayıs: ilk üretilen klipler. 19–20 Mayıs: duyuru. Google'ın açılış konuşmasına altı gün — Gemini Omni hakkında bilinenler ve bilinmeyenler.
İki perdelik bir sızıntı
Henüz duyurulmamış bir model için Gemini Omni'nin alışılmadık derecede iyi belgelenmiş bir giriş süreci oldu. İz 2 Mayıs 2026'da başlıyor: bir X kullanıcısı Gemini'nin video üretim sekmesinde gizli bir UI dizgisi buldu: «Start with an idea or try a template. Powered by Omni». TestingCatalog aynı gün yayımladı. Dizgi dokuz gün orada kaldı, herkes spekülasyon yaptı.
Sonra 11 Mayıs 2026'da ikinci ayakkabı düştü. Açık Veo 3.1'den farklı bir şeyin ürettiği belli olan klipler en az bir Gemini Pro hesabından sızdı. En çok ilgi çeken iki klip: deniz kenarındaki bir restoranda spagetti sahnesi, bir profesörün karatahtada trigonometrik ispatlar çözmesi. 24 saat içinde 9to5Google, Android Authority, Chrome Unboxed ve düzinelerce başka yayın haberi aldı.
Sıradaki büyük olay 19–20 Mayıs'ta Google I/O 2026. Bunu okuduğunuzda muhtemelen altı gün kalmış olacak. Google, Gemini ve yapay zeka güncellemelerinin gündemde olduğunu onayladı. Omni'yi ismen onaylamadı.
Bu yazı 13 Mayıs anlık görüntüsü — boşluğun tam ortası. Ne gerçek, ne spekülasyon, klipler ne ima ediyor ve açılış konuşması başladığında gerçekten neye dikkat etmeli. I/O sonrası güncelleyeceğiz.
Zaman çizelgesi bir bakışta
| Tarih | Olay | Kaynak güvenilirliği |
|---|---|---|
| 2 Mayıs 2026 | «Powered by Omni» UI dizgisi Gemini video sekmesinde bulundu | Yüksek — ekran görüntüsü dolaşımda |
| 2–10 Mayıs 2026 | Spekülasyon evresi. Somut çıktı yok, ama birden çok yayın dizgiyi doğruluyor | Doğrulandı |
| 11 Mayıs 2026 | Gemini Pro hesabından klipler sızdı — özellikle spagetti sahnesi ve karatahta profesörü | Yüksek — birden çok yayın aynı klipleri bağımsız raporladı |
| 11–12 Mayıs | Genişletilmiş UI dizgisi yüzeyleşti: «Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more» | Doğrulandı |
| 19–20 Mayıs 2026 | Google I/O 2026 açılış konuşması — muhtemel resmi duyuru | Planlandı (henüz gerçekleşmedi) |
İki şey öne çıkıyor. Birincisi, sızıntı ürün içinde oldu, pazarlama bilgi kaçağı değil — Google, duyurudan önce Gemini Pro kullanıcılarının küçük bir alt kümesine Omni'yi yaymaya başlamış görünüyor ve yayılım ekran görüntüsü alınabilecek kadar görünür hale gelmiş. Basın sızıntısından çok daha güvenilir bir sinyal. İkincisi, ikinci UI dizgisi («remix your videos, edit directly in chat, try templates») Google'ın bunu sadece bir model değil iş akışı ürünü olarak konumlandırdığını söylüyor — «edit directly in chat» ve «remix» gibi ifadeler tüketici ürün dili, benchmark dili değil.
İki klip aslında ne gösteriyor
Sızan iki klip şu an mevcut en somut bilgi. İkisi de 10 saniyenin altında kısa ve kullanıcıların Gemini Pro web arayüzü olarak tarif ettikleri ortamda metin istemlerinden üretildi.
Klip 1: Spagetti sahnesi
Deniz kenarındaki bir restoranda spagetti yiyen bir müşteri, gün batımı ışığı, Akdeniz ambiyans sesi. Dikkat çeken görsel sadakat değil — Veo 3.1'in zaten yaptığıyla rekabet ediyor. Dikkat çeken şey spagettinin spagetti gibi davranması. Çatala dolanıyor, ağırlıkla düşüyor ve çatal-ağız hareketi süreklilik kuralına saygı duyuyor. Fizik yükü yüksek yemek sahneleri tarihsel olarak video modellerinin zayıf noktası olmuştur — çatallar ve yemekler doğal olmayan biçimde deforme olur, lifler kopar, yer çekimi yarıda çalışmayı bırakır. Sızan klip bunu temiz yönetiyor; bu da temel modelin açık Veo 3.1'den belirgin biçimde daha iyi bir fizik önseliğine sahip olduğunu düşündürüyor.
Klip 2: Karatahta profesörü
Bir profesör karatahtada trigonometrik ispatlar üzerinde çalışıyor. Kamera o yazarken tahtada kalıyor. Buradaki ilginç nokta metin ve formül oluşturma. Yapay zeka video modelleri tutarlı metinde meşhur biçimde başarısız — harfler kareler arasında kayar, denklemler yarıda anlamsızlaşır ve matematiğe benzeyen her şey genellikle çöker. Sızan karatahta klibi kareler arasında tanınabilir matematiksel notasyonu tutarlı şekilde gösteriyor, profesörün eli de vuruşları doğru takip ediyor. Bu küçük bir iyileştirme değil; iki yıldır kırık bir kategoridir.
İki klip birlikte ne ima ediyor
Sızan klipler temsili ise — bu «ise»yi ciddiye almak gerek, çünkü Google doğal olarak en iyi çıktısını gösteren klipler yayar — o zaman Omni, yapay zeka videosunun en zor iki bilinen zayıflığını hedefliyor: karmaşık fizik ve ekrandaki metin oluşturma. Bu iki nokta, hem Sora 2 geri çekilişinin hem de HappyHorse 1.0 lansmanının bir sonraki cephe olarak işaret ettiği aynı iki nokta. (Kanonik anlatı için bkz. 2026 ortası bilançomuz.)
Demo içeriği seçimi önemli. Spagetti sahnesi ve matematik dersi estetik gösteri değil — rakiplerin güvenilir biçimde yapamadığı şeylere doğrudan nişan alan kabiliyet gösterisi. Bu, Google'ın Omni'yi neye karşı konumlandırdığını söylüyor.
Omni'nin gerçekte ne olduğuna dair üç rakip teori
I/O öncesi spekülasyonun yaşadığı yer burası. Omni'nin neyi temsil ettiğine dair üç inandırıcı yorum var ve pazarın geri kalanı için çok farklı çıkarımlara sahipler.
Teori 1: Veo 3.1'in tüketici yeniden markalaması
En basit yorum: Omni, tüketici Gemini uygulaması içindeki mevcut Veo veri hattının yeni kamuya açık adıdır. Altta yatan üretim yığını değişmez. Google, «Veo» markasını tüketici yüzeyinden çeker, Vertex AI kurumsal API'sinde tutar ve Gemini sohbet deneyimine birleşik bir ürün adı verir.
Lehinde: Google'ın yeniden adlandırma geçmişi var. Bard → Gemini en görünür örnekti. «Veo 3.1» tüketici markası hep beceriksizdi — sürüm numaraları teknik olmayan kullanıcılara satılmaz. UI dizgileri («remix your videos, edit directly in chat») iş akışını vurguluyor, model yeniliğini değil.
Aleyhinde: Sızan klipler açık Veo 3.1'i belirgin biçimde aşan kabiliyet gösteriyor, özellikle fizik ve metin oluşturmada. Saf yeniden markalama gözle görülür biçimde farklı çıktı üretmez. Google sessizce Omni markası altında bir Veo 3.2 göndermiyorsa bu teori klipleri açıklamıyor.
Teori 2: Gemini'de eğitilmiş ayrı bir video modeli
Orta yorum: Omni, Gemini hattında eğitilmiş yeni bir video modeli — DeepMind'in Veo hattından ayrı — ve Google'ın yol haritasında Veo'nun yerine değil yanında yer alıyor. Tüketici Gemini Omni'yi, Vertex AI'daki kurumsal müşteriler Veo'yu kullanmaya devam ediyor. İkisi paralel evriliyor.
Lehinde: Google tarihsel olarak paralel model hatlarını sürdürdü (tüketici için Gemini, kurumsal için ayrı araştırma hatları). Sızan kliplerdeki kabiliyet sıçraması, Veo 3.1'den farklı veri karışımı ve mimaride eğitilmiş bir modelle tutarlı.
Aleyhinde: İki üst seviye video modeli hattı çalıştırmak pahalı. Post-mortem yazımızda ele aldığımız Sora 2 geri çekilişi, OpenAI'nin bile tek bir tüketici video modelini ölçekte sürdüremediğini gösterdi; iki tane çalıştırmak Google için tuhaf bir stratejik seçim olur.
Teori 3: Birleşik omni modeli (görüntü + video + ses tek bir ileri geçişte)
En iddialı yorum: Omni, Gemini'de eğitilmiş yeni bir model ailesinin ilk üyesi olarak görüntü üretimi, video üretimi ve senkronize sesi tek bir ileri geçişte ele alıyor. Bu, HappyHorse 1.0'ın Nisan'da 15B parametreli birleşik ses-video modeliyle Arena #1'i aldığında başlattığı mimari. Bu teoride Omni, mevcut Veo veri hattını (video) ve Nano Banana Pro yığını (görüntü) tek bir çok kipli üreticiyle değiştiriyor.
Lehinde: Ürün adının kendisi — «Omni» — güçlü bir çok kipli kapsama imada. UI çerçevelemesi («our new video model, remix your videos, edit directly in chat») birden çok kipi kapsayan tek bir ürün yüzeyini ima ediyor. HappyHorse'tan birleşik mimari göndermek için gelen rekabet baskısı keskin; Google Nisan'dan beri Arena zirvesini kaybediyor. (Mimari ayrıntılar için HappyHorse 1.0 incelememiz.)
Aleyhinde: Birleşik omni modeller teknik olarak zor ve Google, ByteDance veya Alibaba'ya göre yeni mimarileri tüketiciye göndermede daha tutucu. İki üretim hattını eş zamanlı değiştirmek kamuya açık bir açılış konuşması için yüksek riskli bir hamledir.
Para nereye yatırıyor
Sektör gözlemcileri üç teori arasında kabaca 30/30/40 dağılıyor. UI çerçevelemesi ve kabiliyet sıçramasına dayalı en olası okuma Teori 2 ile 3'ün bir melezi: en azından video ve sesi birleşik olarak ele alan yeni bir Gemini'de eğitilmiş model, Veo ise stabilite gereken kurumsal müşteriler için Vertex AI'da hayatta kalır. Altı gün sonra bileceğiz.
Bu neden Google'ın ötesinde önemli
Omni ilginç değil çünkü Google yeni bir video modeli çıkarıyor. Artık her ay yeni video modelleri çıkıyor. Omni ilginç çünkü Teori 3 doğruysa ne anlama gelir.
Yapay zeka video sektörü 2026'nın ilk dört ayını birleşik omni modeli tezinin açılmasını izleyerek geçirdi. Sora 2 ayrı veri hattı mimarisiyle 84 günde çöktü. HappyHorse 1.0 15B parametreli birleşik mimariyle 48 saatte Arena #1'i aldı. Seedance 2.0 çift kollu Transformer aracılığıyla sesi ve videoyu birlikte gönderiyor. Teknik ağırlık merkezi bir çeyrek boyunca birleşik modellere doğru kayıyordu ve cevap vermemiş tek büyük Batı laboratuvarı Google'dı.
Omni gerçek bir birleşik modelse — Teori 3 — Google Çinli liderlerin kurduğu mimari trendi yakalıyor. Üç aşağı yönlü etkisi var:
- Veo markası birleşir veya emekli olur. Ayrı veri hattına sahip bir Veo'yu birleşik bir Omni ile 12 aydan fazla yan yana çalıştırmanın anlamı yok. Vertex AI'daki kurumsal müşteriler bir göç yolu bekler.
- Batı/Çin mimari farkı kapanır. «Çin modelleri birleşik mimarilere öncülük ettikleri için yapısal avantaja sahip» çerçevesi, Google kendi modelini gönderdiği anda zayıflar.
- Model katmanı farklılaşması daralmaya devam eder. İlk altı modelden dördü birleşik ses-video mimarileri kullanıyorsa model katmanı daha da metalaşır ve agent katmanı tek anlamlı farklılaşma noktası olur. Bu, 2026 ortası bilançomuzun merkezi tezi ve Omni bunu uzatır.
Omni yalnızca yeniden markalama (Teori 1) ise yukarıdakilerin çoğu uygulanmaz. Ama sızan klipler Teori 1'i üçü içinde en olası olmayan kılıyor.
I/O'da neyi izlemeli — altı maddelik kontrol listesi
19 Mayıs'ta açılış konuşması başladığında hangi teorinin doğru olduğunu şu sinyaller söyler. Tek başına hiçbiri kesin değil ama birlikte net bir tablo oluştururlar.
Sinyal 1: Google açılış sahnesinde hâlâ «Veo» diyor mu?
Tüketiciye dönük Gemini segmentinde Veo dikkat çekici biçimde yoksa bu Veo'nun tüketici markası olarak emekli olduğunun kanıtı. Veo hâlâ Omni'nin yanında anılıyorsa ikisi bir arada (Teori 2). İkisi de anılıyor ama Veo yalnızca kurumsal olarak konumlandırılıyorsa göç başlıyor demektir.
Sinyal 2: Omni sesi videoyla aynı çağrıda mı üretiyor?
Senkronize video + ses döndüren tek bir API çağrısı birleşik omni modelinin (Teori 3) teknik imzasıdır. Önce video, sonra ses sentezi için ikinci bir çağrı — eski mimari deseni. Açılış demosu bunu açıkça gösterecektir.
Sinyal 3: Omni görüntü üretimini de ele alıyor mu?
Omni yalnızca yeni video modeli olarak konumlanırsa kapsam dardır. Omni görüntü üretimini de soğurursa — Gemini sohbet yüzeyindeki Nano Banana Pro'nun yerini alırsa — daha geniş birleşik kiplilik tezinin kanıtıdır. Açılıştaki görüntü üretimi demolarının «Omni» adına mı yoksa Nano Banana / Imagen markalı mı kaldığını izleyin.
Sinyal 4: İlk gün API var mı?
Veo 3.1 açılış gününde Vertex AI'da yayınlanmıştı. Omni 19–20 Mayıs'ta kamuya açık API erişimi ve fiyatla çıkarsa derhal üretim kullanımı için konumlanmış demektir. Yalnızca tüketici olarak çıkarsa ve API «bu yıl içinde» denirse Google Sora 2'nin perakende-önce yolunu izliyor — ki bunun ölçekte ekonomik olarak işlemediğini gördük.
Sinyal 5: Fiyatlandırma yapısı nasıl?
Mevcut kamuya açık üst seviye API fiyatlandırma referansı kabaca 0,05 $/sn (HappyHorse 1.0) ile 0,50 $/sn (Veo 3.1) arasında. Omni API fiyatı HappyHorse'a yakınsa Google maliyet üzerinden rekabet ediyor; Veo 3.1'e yakınsa kalite üzerinden. Seçim, Google'ın hangi pazarı önceliklendirdiğini söyler.
Sinyal 6: Project Astra nasıl uyuyor?
Google 2024'ten beri her I/O'da Project Astra'yı — gerçek zamanlı çok kipli asistanını — gösteriyor. Astra 19–20 Mayıs'ta aniden ürün olur ve altında Omni'yi kullanırsa, daha geniş «omni» tezi bu olur: yalnızca bir video modeli değil, tüm Gemini deneyimini kapsayan gerçek zamanlı çok kipli yapay zeka yüzeyi.
Bu iş akışınız için ne anlama geliyor
Açılışı beklerken pratik üç madde.
Gemini'yi doğrudan kullanan bir içerik üreticisiyseniz
Henüz hiçbir şeyi değiştirmeyin. Tüketici Gemini uygulamasındaki Omni, gelecek hafta çıkarsa mevcut video üretim deneyimini basitçe değiştirir veya yükseltir. «remix your videos, edit directly in chat» ifadesi, altında daha akıllı bir model olan ve zaten bildiğiniz sohbet odaklı iş akışını ima eder. Duyuruyu bekleyin, yeni yetenekleri deneyin ve gerçekten değişene göre istemlerinizi ayarlayın.
Vertex AI üzerinde geliştiriyorsanız
Sinyal 1'i (Veo markası) ve Sinyal 4'ü (API kullanılabilirliği) dikkatle izleyin. Veo tüketici markası olarak emekli edilirken kurumsal için Vertex AI'da kalırsa mevcut entegrasyonunuz güvende. Omni Vertex AI'da Veo'yu tamamen değiştirirse önünüzde bir API göçü var. Her iki durumda da entegrasyonunuzu bir agent veya orkestrasyon katmanı üzerinden inşa edin ki model değişimi kod değişikliği değil yapılandırma değişikliği olsun.
Çok modelli agent yığını işletiyorsanız
Bu son makalelerimizde savunduğumuz durum. (Altı kayma ve uzun biçim darboğazları'na bakın.) Çok modelli bir agent Omni'yi yönlendirilecek başka bir üretici olarak ele alır — Veo, Seedance, HappyHorse, Kling, Luma ve Runway ile yan yana. Agent katmanı verimli sorunun yaşadığı yerdir: bu 60 saniyelik videodaki hangi çekim hangi modele yönlendirilir. Omni duyurusu yönlendirme tablosuna bir seçenek daha ekler; çalıştırdığınız mimariyi değiştirmez.
Genra'nın yığınını modelden bağımsız tutmamızın tam nedeni: model katmanı hareket etmeye devam ediyor, agent katmanı ise birikiyor.
Sonuç, I/O'dan altı gün önce
Bildiklerimiz: Gemini'nin video sekmesi içinde Omni adında gerçek bir model var, çıktısı fizik ve metinde açık Veo 3.1'i belirgin biçimde aşıyor ve Google bunu sohbet tabanlı iş akışı ürünü olarak çerçeveliyor. Bilmediklerimiz: bunun bir yeniden markalama mı, paralel yeni bir model mi yoksa birleşik omni kiplilik sistemi mi olduğu.
En faydalı tek tahmin üçüncü olanı. Teori 3 doğruysa 19 Mayıs'ta Batı/Çin mimari farkı kapanır ve sektör tüm büyük laboratuvarların birleşik ses-video mimarilerini çalıştırdığı çok kutuplu bir yarışa döner. Teori 3 yanlışsa Google HappyHorse'un belirlediği mimari cephenin hâlâ arkasındadır — ve rekabet manzarası Nisan'daki HappyHorse lansmanı sonrasıyla aynı kalır.
Her iki durumda da pratik sonuç aynı: model katmanı hareket etmeye devam ediyor, agent katmanı ise inşa etmeniz gereken yer. Omni bunu değiştirmez. Ya güçlendirir (yönlendirme tablosuna başka bir meta model ekleyerek) ya iğneyi oynatmaz (yeniden markalama ise). Farklılaşmasını agent altyapısına çoktan taşıyan ekipler 19'da Google'ın duyurduğunu yapılandırma güncellemesi olarak emecek. Hâlâ tek kahraman modele bahse giren ekipler ise 2. çeyreğin geri kalanını yeniden uydurmaya harcayacak.
Açılıştan sonra bu yazıyı gerçekten duyurulanlarla güncelleyeceğiz.
SSS
Gemini Omni nedir?
Gemini Omni, Google'ın Gemini arayüzü içinde iki sızıntı aracılığıyla yüzeyleşen, duyurulmamış bir yapay zeka video üretim modelidir — 2 Mayıs 2026'da fark edilen bir UI dizgisi ve 11 Mayıs'ta bir Gemini Pro hesabından sızan üretilmiş video klipler. Google, 13 Mayıs itibarıyla Omni'yi resmi olarak onaylamadı. En olası duyuru penceresi 19–20 Mayıs Google I/O 2026.
Gemini Omni Veo'nun yerine mi geçecek?
Onaylanmadı. Üç teori sahada: Omni Veo 3.1'in tüketici yeniden markalaması, Omni Veo ile bir arada yaşayan ayrı yeni bir Gemini'de eğitilmiş model veya Omni hem Veo'yu hem de görüntü yığınını değiştiren birleşik omni kiplilik modeli. Sızan klipler mevcut açık Veo 3.1'i aşan kabiliyet öneriyor; bu da saf yeniden markalama teorisini en olası olmayan yapıyor.
Sızan klipler neyi gösterdi?
En çok ilgi gören iki klip: deniz kenarındaki restoranda spagetti sahnesi (fizik yükü yüksek yemek hareketini idare etmesi dikkat çekici) ve karatahtada trigonometrik ispatlar çözen profesör (kareler arasında tutarlı matematiksel notasyon oluşturması dikkat çekici). Her ikisi de video modelleri için tanınan zayıf bölgeler.
Omni'nin gerçekte ne olduğunu ne zaman bileceğiz?
19–20 Mayıs Google I/O 2026. Altı sinyali izleyin: Veo hâlâ anılıyor mu, ses videoyla aynı çağrıda üretiliyor mu, görüntü üretimi dahil mi, ilk gün API var mı, fiyatlandırma nasıl ve Project Astra nasıl uyuyor.
Duyurudan önce içerik üreticisi olarak ne yapmalıyım?
Henüz hiçbir şeyi değiştirmeyin. Tüketici Gemini kullanıyorsanız lansmanı bekleyin. Vertex AI'daysanız API göç yoluna dikkat edin. Çok modelli agent yığını işletiyorsanız Omni'yi yönlendirilecek başka bir üretici olarak ele alın.
Omni HappyHorse 1.0 ile nasıl karşılaştırılır?
HappyHorse 1.0, 7 Nisan 2026'da çıktıktan 48 saat sonra 15B parametreli birleşik ses-video mimarisiyle Artificial Analysis Video Arena #1'i aldı. Omni de birleşik omni model ise bu mimari yönelime Google'ın ilk yanıtını temsil eder.
Yazar hakkında
Chris Sherman yapay zeka video teknolojisini ve yaratıcı üretim iş akışlarını yazıyor. 19–20 Mayıs Google I/O 2026 açılış konuşmasında canlı yayın için @GenraAI'ı takip edin.