Gemini Omni: เบาะแสจริงจากข้อมูลรั่วก่อน I/O

2 พฤษภาคม สตริง UI 11 พฤษภาคม คลิปแรกที่ถูกสร้างขึ้น 19–20 พฤษภาคม การประกาศ หกวันก่อนคีย์โน้ตของ Google — นี่คือสิ่งที่รู้เกี่ยวกับ Gemini Omni และสิ่งที่ยังไม่รู้

การรั่วสองฉาก

สำหรับโมเดลที่ยังไม่ประกาศ Gemini Omni มีการอุ่นเครื่องที่บันทึกได้อย่างผิดปกติ ร่องรอยเริ่มที่ 2 พฤษภาคม 2026 เมื่อผู้ใช้ X พบสตริง UI ซ่อนอยู่ในแท็บสร้างวิดีโอของ Gemini ว่า «Start with an idea or try a template. Powered by Omni» TestingCatalog เขียนรายงานในวันเดียวกัน สตริงนั้นอยู่ที่นั่นเก้าวันท่ามกลางการคาดเดา

จากนั้นวันที่ 11 พฤษภาคม 2026 รองเท้าข้างที่สองตก คลิปที่ถูกสร้างขึ้น — เห็นชัดว่าผลิตจากสิ่งที่ต่างจาก Veo 3.1 รุ่นสาธารณะ — รั่วจากบัญชี Gemini Pro อย่างน้อยหนึ่งบัญชี สองคลิปได้รับความสนใจมากที่สุด ฉากสปาเก็ตตี้ในร้านอาหารริมทะเลและอาจารย์เขียนพิสูจน์ตรีโกณมิติบนกระดานดำ ภายใน 24 ชั่วโมง 9to5Google, Android Authority, Chrome Unboxed และสำนักข่าวอีกหลายสิบรายเสนอข่าวต่อ

เหตุการณ์ใหญ่ถัดไปคือ Google I/O 2026 วันที่ 19–20 พฤษภาคม ตอนคุณอ่านนี่ น่าจะเหลือหกวัน Google ยืนยันว่าการอัปเดต Gemini และ AI อยู่ในวาระ ยังไม่ยืนยัน Omni โดยชื่อ

บทความนี้คือภาพถ่ายของวันที่ 13 พฤษภาคม — กลางช่วงเวลา อะไรจริง อะไรคาดเดา คลิปบอกอะไร และต้องเฝ้าดูอะไรเมื่อคีย์โน้ตเริ่ม จะอัปเดตหลัง I/O

ไทม์ไลน์อย่างย่อ

วันที่	เหตุการณ์	ความน่าเชื่อถือ
2 พฤษภาคม 2026	พบสตริง UI «Powered by Omni» ในแท็บวิดีโอ Gemini	สูง — ภาพหน้าจอแพร่หลาย
2–10 พฤษภาคม 2026	ช่วงคาดเดา ไม่มีผลผลิตเป็นรูปธรรม แต่หลายสำนักยืนยันสตริง	ยืนยันแล้ว
11 พฤษภาคม 2026	คลิปรั่วจากบัญชี Gemini Pro — โดยเฉพาะฉากสปาเก็ตตี้และอาจารย์กระดานดำ	สูง — หลายสำนักรายงานคลิปเดียวกันโดยอิสระ
11–12 พฤษภาคม	สตริง UI ฉบับเต็มกว่าเดิมปรากฏ: «Create with Gemini Omni: meet our new video model, remix your videos, edit directly in chat, try templates, and more»	ยืนยันแล้ว
19–20 พฤษภาคม 2026	คีย์โน้ต Google I/O 2026 — การประกาศอย่างเป็นทางการที่น่าจะเกิด	กำหนดการ (ยังไม่เกิด)

สองประเด็นน่าสังเกต ประการแรก การรั่วเกิด ในตัวผลิตภัณฑ์ ไม่ใช่จากการตลาดที่หลุด — ดูเหมือน Google เริ่มทยอยปล่อย Omni แก่ผู้ใช้ Gemini Pro กลุ่มเล็กก่อนการประกาศ และการทยอยมองเห็นได้ชัดพอจะถูกถ่ายภาพหน้าจอ นี่คือสัญญาณที่น่าเชื่อถือกว่าการรั่วถึงสื่อ ประการที่สอง สตริง UI ที่สอง («remix your videos, edit directly in chat, try templates») บอกว่า Google กำลังจัดวางสิ่งนี้เป็นผลิตภัณฑ์เวิร์กโฟลว์ ไม่ใช่แค่โมเดล — สำนวนอย่าง «edit directly in chat» และ «remix» คือภาษาผลิตภัณฑ์ผู้บริโภค ไม่ใช่ภาษาเบนช์มาร์ก

สองคลิปแสดงอะไรจริงๆ

สองคลิปที่รั่วคือข้อมูลที่เป็นรูปธรรมที่สุดในตอนนี้ ทั้งคู่สั้นต่ำกว่า 10 วินาที และสร้างจากพรอมต์ข้อความในสิ่งที่ผู้ใช้บรรยายว่าเป็นเว็บอินเทอร์เฟส Gemini Pro

คลิป 1: ฉากสปาเก็ตตี้

ผู้รับประทานในร้านอาหารริมทะเลกินสปาเก็ตตี้ แสงพระอาทิตย์ตก เสียงแวดล้อมเมดิเตอร์เรเนียน ที่น่าสังเกตไม่ใช่ความคมชัดของภาพ — มันเทียบเท่ากับสิ่งที่ Veo 3.1 ทำอยู่แล้ว ที่น่าสังเกตคือสปาเก็ตตี้ประพฤติตัวเหมือนสปาเก็ตตี้ ม้วนรอบส้อม ตกด้วยน้ำหนัก การเคลื่อนไหวส้อม-สู่ปากเคารพความต่อเนื่อง ฉากอาหารที่มีฟิสิกส์หนักเป็นจุดอ่อนของโมเดลวิดีโอมาแต่ไหนแต่ไร — ภาชนะและอาหารผิดรูปอย่างไม่เป็นธรรมชาติ เส้นขาด แรงโน้มถ่วงหยุดทำงานกลางทาง คลิปที่รั่วจัดการสิ่งนี้อย่างสะอาด แสดงว่าโมเดลพื้นฐานมีไพรเออร์ทางฟิสิกส์ที่ดีขึ้นชัดเจนกว่า Veo 3.1 สาธารณะ

คลิป 2: อาจารย์กระดานดำ

อาจารย์เขียนพิสูจน์ตรีโกณมิติบนกระดานดำ กล้องอยู่กับกระดานขณะเขาเขียน สิ่งน่าสนใจที่นี่คือการเรนเดอร์ข้อความและสูตร โมเดลวิดีโอ AI มีชื่อเสียงในด้านข้อความที่ไม่สอดคล้อง — ตัวอักษรลอยไปมาระหว่างเฟรม สมการกลายเป็นภาษาแปลกๆ กลางคัน อะไรที่เหมือนคณิตศาสตร์มักพังทลาย คลิปกระดานที่รั่วแสดงสัญลักษณ์ทางคณิตศาสตร์ที่จดจำได้ เรนเดอร์อย่างต่อเนื่องข้ามเฟรม และมืออาจารย์ลากเส้นได้ถูกต้อง นี่ไม่ใช่การปรับปรุงเล็กน้อย แต่เป็นหมวดที่พังมาสองปี

สองคลิปร่วมกันบอกอะไร

หากคลิปที่รั่วเป็นตัวแทน — และต้องรับ «หาก» นี้อย่างจริงจัง เพราะ Google ย่อมจะปล่อยคลิปที่แสดงผลผลิตที่ดีที่สุด — Omni กำลังพุ่งเป้าจุดอ่อนที่หินที่สุดสองข้อของวิดีโอ AI: ฟิสิกส์ซับซ้อนและการเรนเดอร์ข้อความบนหน้าจอ สองจุดนี้คือเรื่องเดียวกันที่การถอนตัวของ Sora 2 และการเปิดตัว HappyHorse 1.0 ชี้ว่าเป็นแนวรบต่อไป (สำหรับเรื่องเล่าหลัก โปรดดูบทสรุปกลางปี 2026)

การเลือกเนื้อหาเดโมสำคัญ ฉากสปาเก็ตตี้และคาบเรียนคณิตศาสตร์ไม่ใช่การโชว์สุนทรียะ — เป็นการโชว์ความสามารถที่จงใจมุ่งไปยังจุดที่คู่แข่งทำไม่ได้แน่นอน นั่นบอกว่า Google วาง Omni ไว้ต่อกับใคร

สามทฤษฎีที่แข่งขันว่า Omni คืออะไรกันแน่

การคาดเดาก่อน I/O อยู่ตรงนี้ มีสามการตีความที่ฟังขึ้นว่า Omni คืออะไร และผลกระทบต่อตลาดที่เหลือต่างกันมาก

ทฤษฎี 1: การรีแบรนด์ฝั่งผู้บริโภคของ Veo 3.1

การตีความที่ง่ายที่สุด: Omni เป็นเพียงชื่อสาธารณะใหม่ของไปป์ไลน์ Veo เดิมในแอป Gemini ฝั่งผู้บริโภค สแต็คการสร้างเบื้องล่างไม่เปลี่ยน Google ดึงแบรนด์ «Veo» ออกจากหน้าผู้บริโภค คงไว้สำหรับ API องค์กรของ Vertex AI และมอบชื่อผลิตภัณฑ์รวมให้กับประสบการณ์แชทของ Gemini

สนับสนุน: Google มีประวัติเปลี่ยนชื่อ Bard → Gemini คือตัวอย่างที่ชัดที่สุด แบรนด์ผู้บริโภค «Veo 3.1» อึดอัดเสมอ — หมายเลขเวอร์ชันขายไม่ได้กับผู้ใช้ทั่วไป สตริง UI («remix your videos, edit directly in chat») เน้นเวิร์กโฟลว์ ไม่ใช่ความใหม่ของโมเดล

คัดค้าน: คลิปที่รั่วแสดงความสามารถเหนือ Veo 3.1 สาธารณะอย่างเห็นได้ชัด โดยเฉพาะฟิสิกส์และการเรนเดอร์ข้อความ การรีแบรนด์แบบล้วนๆ จะไม่ผลิตผลผลิตที่ดูต่างกัน ถ้า Google ไม่ได้แอบส่ง Veo 3.2 ภายใต้แบรนด์ Omni ทฤษฎีนี้อธิบายคลิปไม่ได้

ทฤษฎี 2: โมเดลวิดีโอแยกที่ฝึกใน Gemini

การตีความตรงกลาง: Omni คือโมเดลวิดีโอใหม่ที่ฝึกในสาย Gemini — แยกจากไปป์ไลน์ Veo ของ DeepMind — และยืนเคียงข้าง Veo ในโรดแมปของ Google แทนการแทนที่ Gemini ฝั่งผู้บริโภคใช้ Omni ลูกค้าองค์กรบน Vertex AI ใช้ Veo ต่อ ทั้งคู่วิวัฒน์ขนานกัน

สนับสนุน: Google มีประวัติรักษาสายโมเดลขนาน (Gemini สำหรับผู้บริโภค สายวิจัยแยกสำหรับองค์กร) การก้าวกระโดดในคลิปสอดคล้องกับโมเดลที่ฝึกบนข้อมูลและสถาปัตยกรรมต่างจาก Veo 3.1

คัดค้าน: เดินสายโมเดลวิดีโอระดับบนสองสายแพง การถอนตัวของ Sora 2 ที่เราเขียนถึงในการชันสูตรแสดงว่าแม้แต่ OpenAI ก็เลี้ยงโมเดลวิดีโอผู้บริโภคหนึ่งตัวในสเกลไม่ได้ การเดินสองตัวจะเป็นทางเลือกเชิงกลยุทธ์ที่แปลกของ Google

ทฤษฎี 3: โมเดลออมนิรวม (ภาพ + วิดีโอ + เสียงใน forward pass เดียว)

การตีความที่ทะเยอทะยานที่สุด: Omni เป็นสมาชิกแรกของตระกูลโมเดลใหม่ที่ฝึกใน Gemini ที่จัดการการสร้างภาพ การสร้างวิดีโอ และเสียงที่ซิงค์ใน forward pass เดียว นี่คือสถาปัตยกรรมที่ HappyHorse 1.0 เบิกทางตอนคว้า Arena #1 ในเดือนเมษายนด้วยโมเดลรวมเสียง-วิดีโอ 15B พารามิเตอร์ ภายใต้ทฤษฎีนี้ Omni แทนที่ทั้งไปป์ไลน์ Veo ปัจจุบัน (วิดีโอ) และสแต็ค Nano Banana Pro (ภาพ) ด้วยเครื่องสร้างมัลติโมดอลเดียว

สนับสนุน: ชื่อผลิตภัณฑ์ «Omni» เอง บ่งบอกขอบเขตมัลติโมดอลอย่างรุนแรง การจัดกรอบ UI («our new video model, remix your videos, edit directly in chat») ชี้ไปที่หน้าผลิตภัณฑ์เดียวที่ครอบคลุมหลายโมดอลิตี้ แรงกดดันจาก HappyHorse ให้ส่งสถาปัตยกรรมรวมรุนแรง Google เสียอันดับ Arena มาตั้งแต่เมษายน (รายละเอียดสถาปัตยกรรมในรีวิว HappyHorse 1.0)

คัดค้าน: โมเดลออมนิรวมยากในทางเทคนิค Google ระมัดระวังกว่า ByteDance หรือ Alibaba ในการส่งสถาปัตยกรรมใหม่สู่ผู้บริโภค การแทนที่ไปป์ไลน์การผลิตสองสายพร้อมกันเป็นการเคลื่อนที่เสี่ยงสำหรับคีย์โน้ตสาธารณะ

เงินอยู่ตรงไหน

ผู้สังเกตวงการแบ่งราว 30/30/40 ในสามทฤษฎี การอ่านที่น่าจะที่สุดจากการจัดกรอบ UI และการก้าวกระโดดคือไฮบริดของทฤษฎี 2 และ 3 — โมเดล Gemini ใหม่ที่อย่างน้อยจัดการวิดีโอและเสียงร่วมกัน Veo ยังอยู่บน Vertex AI ให้ลูกค้าองค์กรที่ต้องการความเสถียร อีกหกวันจะรู้

ทำไมเรื่องนี้สำคัญเกินกว่า Google

Omni ไม่ได้น่าสนใจเพราะ Google ปล่อยโมเดลวิดีโอใหม่ ตอนนี้โมเดลวิดีโอใหม่ออกทุกเดือน Omni น่าสนใจเพราะถ้าทฤษฎี 3 ถูก จะหมายความว่าอะไร

วงการวิดีโอ AI ใช้สี่เดือนแรกของปี 2026 ดูทฤษฎีโมเดลออมนิรวมคลี่ตัว Sora 2 ล่มใน 84 วันด้วยสถาปัตยกรรมไปป์ไลน์แยก HappyHorse 1.0 คว้า Arena #1 ใน 48 ชั่วโมงด้วยสถาปัตยกรรมรวม 15B Seedance 2.0 ส่งเสียงและวิดีโอพร้อมกันผ่าน Transformer สองสาขา จุดศูนย์ถ่วงทางเทคนิคขยับสู่โมเดลรวมตลอดหนึ่งไตรมาส และห้องแล็บใหญ่ฝั่งตะวันตกเดียวที่ยังไม่ตอบคือ Google

ถ้า Omni เป็นโมเดลรวมแท้ — ทฤษฎี 3 — Google ก็ตามทันแนวสถาปัตยกรรมที่ผู้นำจีนวาง มีผลพลอยได้สามอย่าง:

แบรนด์ Veo รวมหรือเกษียณ เดิน Veo ไปป์ไลน์แยกข้าง Omni รวมเกิน 12 เดือนไม่สมเหตุสมผล ลูกค้าองค์กรบน Vertex AI จะคาดหวังเส้นทางย้าย
ช่องว่างสถาปัตยกรรมตะวันตก/จีนปิด กรอบ «โมเดลจีนนำเชิงโครงสร้างเพราะบุกเบิกสถาปัตยกรรมรวม» อ่อนลงทันทีที่ Google ส่งของตน
ความแตกต่างชั้นโมเดลถูกบีบต่อ ถ้าสี่ในหกโมเดลอันดับต้นใช้สถาปัตยกรรมรวมเสียง-วิดีโอ ชั้นโมเดลกลายเป็นสินค้าโภคภัณฑ์มากขึ้น และชั้น agent กลายเป็นจุดสร้างความแตกต่างเดียวที่สำคัญ นี่คือทฤษฎีหลักของบทสรุปกลางปี 2026 และ Omni จะต่อยอด

ถ้า Omni เป็นแค่การรีแบรนด์ (ทฤษฎี 1) ส่วนใหญ่ข้างต้นไม่ใช้ แต่คลิปที่รั่วทำให้ทฤษฎี 1 เป็นไปได้น้อยที่สุดในสามทฤษฎี

สิ่งที่ต้องเฝ้าดูใน I/O — เช็คลิสต์หกข้อ

เมื่อคีย์โน้ตเริ่ม 19 พฤษภาคม นี่คือสิ่งที่บอกว่าทฤษฎีใดถูก สัญญาณเดี่ยวไม่ตัดสิน แต่รวมกันสร้างภาพชัด

สัญญาณ 1: Google ยังพูด «Veo» บนเวทีคีย์โน้ตไหม

ถ้า Veo หายไปอย่างเด่นชัดจากเซกเมนต์ Gemini ฝั่งผู้บริโภค นั่นเป็นหลักฐานว่า Veo กำลังเกษียณในฐานะแบรนด์ผู้บริโภค ถ้า Veo ยังถูกพูดถึงควบกับ Omni ทั้งคู่อยู่ร่วมกัน (ทฤษฎี 2) ถ้าทั้งคู่ถูกพูดถึงแต่ Veo วางไว้สำหรับองค์กรเท่านั้น การย้ายเริ่มแล้ว

สัญญาณ 2: Omni สร้างเสียงในการเรียกเดียวกับวิดีโอไหม

การเรียก API เดียวที่คืนวิดีโอ+เสียงซิงค์คือลายเซ็นทางเทคนิคของโมเดลออมนิรวม (ทฤษฎี 3) การเรียก API สองครั้งแยกกัน — วิดีโอก่อนแล้วเรียกที่สองสำหรับสังเคราะห์เสียง — เป็นรูปแบบเก่า เดโมคีย์โน้ตน่าจะแสดงชัดเจน

สัญญาณ 3: Omni จัดการการสร้างภาพด้วยไหม

ถ้า Omni วางเป็นโมเดลวิดีโอใหม่เท่านั้น ขอบเขตแคบลง ถ้า Omni ซึมซับการสร้างภาพ — แทนที่ Nano Banana Pro ภายในหน้าแชท Gemini — นั่นเป็นหลักฐานของทฤษฎีโมดอลิตี้รวมที่กว้างกว่า ดูว่าเดโมการสร้างภาพในคีย์โน้ตยกเครดิตให้ «Omni» หรืออยู่ภายใต้ Nano Banana / Imagen

สัญญาณ 4: มี API ในวันแรกไหม

Veo 3.1 เปิดตัวบน Vertex AI ในวันแรกของคีย์โน้ตของมัน ถ้า Omni ออกพร้อม API สาธารณะและราคาในวันที่ 19–20 พฤษภาคม มันถูกวางให้ใช้งานในโปรดักชันทันที ถ้าออกเฉพาะผู้บริโภคโดย API «อีกหน่อยปีนี้» Google เดินทาง retail-first ของ Sora 2 ซึ่งเราเห็นแล้วว่าไม่คุ้มในสเกล

สัญญาณ 5: โครงสร้างราคาเป็นอย่างไร

เกณฑ์ราคา API ระดับบนปัจจุบันอยู่ราว $0.05/วินาที (HappyHorse 1.0) ถึง $0.50/วินาที (Veo 3.1) ถ้าราคา API ของ Omni ใกล้ HappyHorse Google แข่งที่ต้นทุน ใกล้ Veo 3.1 แข่งที่คุณภาพ ทางเลือกบอกว่า Google ให้ความสำคัญตลาดใด

สัญญาณ 6: Project Astra เข้ามาอย่างไร

Google เดโม Project Astra — ผู้ช่วยมัลติโมดอลแบบเรียลไทม์ — ทุก I/O ตั้งแต่ 2024 ถ้า Astra กลายเป็นผลิตภัณฑ์ในวันที่ 19–20 พฤษภาคม และใช้ Omni เบื้องล่าง นั่นคือทฤษฎี «omni» ที่กว้างกว่า — ไม่ใช่แค่โมเดลวิดีโอแต่เป็นหน้า AI มัลติโมดอลเรียลไทม์ครอบประสบการณ์ Gemini ทั้งหมด

มันหมายถึงอะไรต่อเวิร์กโฟลว์ของคุณ

สามประเด็นปฏิบัติระหว่างรอคีย์โน้ต

ถ้าคุณเป็นครีเอเตอร์ที่ใช้ Gemini ตรง

ยังไม่ต้องเปลี่ยนอะไร Omni ในแอป Gemini ผู้บริโภค ถ้าออกสัปดาห์หน้า ก็จะแทนที่หรืออัปเกรดประสบการณ์การสร้างวิดีโอเดิม สูตร «remix your videos, edit directly in chat» ชี้ไปที่เวิร์กโฟลว์ที่ขับเคลื่อนด้วยแชทแบบเดิมที่คุณรู้จัก โดยมีโมเดลที่ฉลาดกว่าอยู่ใต้ รอประกาศ ลองความสามารถใหม่ ปรับพรอมต์ตามที่เปลี่ยนจริง

ถ้าคุณสร้างบน Vertex AI

เฝ้าสัญญาณ 1 (แบรนด์ Veo) และสัญญาณ 4 (พร้อมใช้งานของ API) อย่างใกล้ชิด ถ้า Veo เกษียณในฐานะแบรนด์ผู้บริโภคแต่ยังอยู่บน Vertex AI สำหรับองค์กร การผสานปัจจุบันของคุณปลอดภัย ถ้า Omni แทนที่ Veo ทั้งหมดบน Vertex AI การย้าย API รออยู่ ไม่ว่าทางใด สร้างการผสานผ่าน agent หรือชั้น orchestration เพื่อให้การเปลี่ยนโมเดลเป็นการเปลี่ยนการตั้งค่า ไม่ใช่โค้ด

ถ้าคุณรันสแต็ก agent หลายโมเดล

นี่คือสถานการณ์ที่เราสนับสนุนในบทความล่าสุด (ดู หกการขยับ และคอขวดวิดีโอยาว) agent หลายโมเดลปฏิบัติต่อ Omni เป็นเครื่องสร้างอีกตัวให้ route ไป — เคียงข้าง Veo, Seedance, HappyHorse, Kling, Luma และ Runway ชั้น agent คือที่ที่คำถามมีผลผลิตอยู่: ช็อตไหนในวิดีโอ 60 วินาทีนี้ route ไปโมเดลใด ประกาศของ Omni เพิ่มอีกหนึ่งทางเลือกในตาราง routing ไม่เปลี่ยนสถาปัตยกรรมที่คุณรัน

นี่คือเหตุผลที่เรารักษาสแต็กของ Genra ให้อิสระจากโมเดล — ชั้นโมเดลขยับต่อ ชั้น agent คือที่สะสม

บทสรุป หกวันก่อน I/O

สิ่งที่เรารู้: มีโมเดลจริงชื่อ Omni ในแท็บวิดีโอของ Gemini สร้างผลผลิตที่ดีกว่า Veo 3.1 สาธารณะอย่างเห็นได้ชัดทั้งฟิสิกส์และข้อความ และ Google จัดกรอบเป็นผลิตภัณฑ์เวิร์กโฟลว์ที่ขับเคลื่อนด้วยแชท สิ่งที่เราไม่รู้: เป็นการรีแบรนด์ โมเดลใหม่ขนาน หรือระบบออมนิ-โมดอลรวม

การทำนายเดี่ยวที่มีประโยชน์สุดคือข้อที่สาม ถ้าทฤษฎี 3 ถูก ช่องว่างสถาปัตยกรรมตะวันตก/จีนปิด 19 พฤษภาคม และวงการกลับสู่การแข่งหลายขั้วที่ทุกแล็บใหญ่รันสถาปัตยกรรมรวมเสียง-วิดีโอ ถ้าทฤษฎี 3 ผิด Google ยังตามหลังแนวรบที่ HappyHorse ตั้ง — และภาพการแข่งขันยังเหมือนหลังเปิดตัว HappyHorse เมษายน

ไม่ว่าทางใด ข้อสรุปเชิงปฏิบัติเหมือนกัน: ชั้นโมเดลขยับต่อ ชั้น agent คือที่คุณควรสร้าง Omni ไม่เปลี่ยนสิ่งนั้น มันเสริม (โดยเพิ่มโมเดลโภคภัณฑ์อีกตัวในตาราง routing) หรือไม่ขยับเข็ม (ถ้าเป็นการรีแบรนด์) ทีมที่ย้ายความแตกต่างไปที่โครงสร้างพื้นฐาน agent แล้วจะซึมซับสิ่งที่ Google ประกาศวันที่ 19 เป็นการอัปเดตการตั้งค่า ทีมที่ยังเดิมพันโมเดลฮีโร่เดี่ยวจะใช้ Q2 ที่เหลือปรับตัว

เราจะอัปเดตบทความนี้หลังคีย์โน้ตด้วยสิ่งที่ประกาศจริง

FAQ

Gemini Omni คืออะไร

Gemini Omni เป็นโมเดลการสร้างวิดีโอ AI ที่ยังไม่ประกาศซึ่งปรากฏผ่านการรั่วสองครั้งภายในอินเทอร์เฟส Gemini ของ Google — สตริง UI ที่พบ 2 พฤษภาคม 2026 และคลิปวิดีโอที่สร้างขึ้นซึ่งรั่วจากบัญชี Gemini Pro วันที่ 11 พฤษภาคม Google ยังไม่ยืนยัน Omni อย่างเป็นทางการ ณ วันที่ 13 พฤษภาคม กรอบเวลาการประกาศที่น่าจะที่สุดคือ Google I/O 2026 วันที่ 19–20 พฤษภาคม

Gemini Omni จะแทนที่ Veo ไหม

ยังไม่ยืนยัน สามทฤษฎีในเกม: Omni เป็นการรีแบรนด์ผู้บริโภคของ Veo 3.1, Omni เป็นโมเดลใหม่แยกที่ฝึกใน Gemini อยู่ร่วมกับ Veo, หรือ Omni เป็นโมเดลออมนิ-โมดอลรวมที่แทนที่ทั้ง Veo และสแต็คการสร้างภาพ คลิปที่รั่วชี้ความสามารถเหนือ Veo 3.1 สาธารณะปัจจุบัน ทำให้ทฤษฎีรีแบรนด์ล้วนเป็นไปได้น้อยที่สุด

คลิปที่รั่วแสดงอะไร

สองคลิปที่ได้ความสนใจมากสุด: ฉากสปาเก็ตตี้ในร้านอาหารริมทะเล (โดดเด่นที่จัดการกับการเคลื่อนไหวอาหารฟิสิกส์หนัก) และอาจารย์เขียนพิสูจน์ตรีโกณมิติบนกระดานดำ (โดดเด่นที่เรนเดอร์สัญลักษณ์คณิตศาสตร์ที่สอดคล้องข้ามเฟรม) ทั้งคู่เป็นจุดอ่อนที่วงการยอมรับสำหรับโมเดลวิดีโอ

เราจะรู้ว่า Omni คืออะไรจริงเมื่อใด

Google I/O 2026 วันที่ 19–20 พฤษภาคม เฝ้าหกสัญญาณ: Veo ยังถูกพูดถึงไหม, เสียงถูกสร้างในการเรียกเดียวกับวิดีโอไหม, การสร้างภาพถูกรวมไหม, มี API ในวันแรกไหม, ราคาเป็นอย่างไร, และ Project Astra เข้ามาอย่างไร

ในฐานะครีเอเตอร์ก่อนประกาศควรทำอะไร

ยังไม่ต้องเปลี่ยน ถ้าใช้ Gemini ผู้บริโภค รอเปิดตัว ถ้าอยู่บน Vertex AI ระวังเส้นทางย้าย API ถ้ารันสแต็ก agent หลายโมเดล ปฏิบัติต่อ Omni เป็นเครื่องสร้างอีกตัวให้ route ไป

Omni เทียบกับ HappyHorse 1.0 อย่างไร

HappyHorse 1.0 คว้า Artificial Analysis Video Arena #1 ใน 48 ชั่วโมงเมื่อเปิดตัว 7 เมษายน 2026 ด้วยสถาปัตยกรรมรวมเสียง-วิดีโอ 15B พารามิเตอร์ ถ้า Omni เป็นโมเดลออมนิรวมด้วย แสดงถึงการตอบรับครั้งแรกของ Google ต่อทิศทางสถาปัตยกรรมนั้น

เกี่ยวกับผู้เขียน
Chris Sherman เขียนเรื่องเทคโนโลยีวิดีโอ AI และเวิร์กโฟลว์การผลิตเชิงสร้างสรรค์ ติดตาม @GenraAI เพื่อรายงานสดระหว่างคีย์โน้ต Google I/O 2026 วันที่ 19–20 พฤษภาคม