สรุป Google I/O 2026: ไม่มี Veo 4 — แต่ Gemini Omni และ Spark ทำให้เลเยอร์เอเจนต์เป็นทางการ

· Chris Sherman

สองเดือนที่ผ่านมา ทั้งอุตสาหกรรมวิดีโอ AI พูดถึง Veo 4 มันไม่ออก สิ่งที่ Google ประกาศใน I/O 2026 ใหญ่กว่าและแปลกกว่า: โมเดลมัลติโมดอลรวมศูนย์ชื่อ Gemini Omni, เอเจนต์คลาวด์ 24/7 ชื่อ Spark, แพ็กเกจ AI Ultra 100 ดอลลาร์ที่รีเซ็ตเพดานราคาผู้บริโภค และสัญญาณชัดเจนว่า Google ตอนนี้มองเลเยอร์เอเจนต์เป็นสมรภูมิแพลตฟอร์มถัดไป นี่คือสรุปฉบับเต็ม

Sundar Pichai ขึ้นเวที Shoreline Amphitheatre เมื่อวานและให้สิ่งที่อุตสาหกรรมวิดีโอ AI ไม่คาดคิด ไม่มี Veo 4 ไม่มีหัวข้อที่ติดแบรนด์ "Veo" เลย แทนที่จะเป็นสิ่งที่น่าสนใจในเชิงกลยุทธ์มากกว่า: Gemini Omni — โมเดลมัลติโมดอลที่จัดการการสร้างข้อความ ภาพ เสียง และวิดีโอแบบเนทีฟในระบบเดียว; Gemini Spark — เอเจนต์ AI ส่วนตัวที่อยู่บน VM ของคลาวด์และทำงานแทนคุณ 24 ชั่วโมงต่อวัน; และการปรับโครงสร้างราคาที่วางแผน AI Ultra 100 ดอลลาร์ไว้กลางเดิมพัน AI สำหรับผู้บริโภคของ Google

คีย์โน้ตเขียนบทใหม่ให้กับ 12 เดือนข้างหน้าของวิดีโอ AI ด้านล่างคือทุกสิ่งที่ Google ประกาศ มันมีความหมายอย่างไรจริง ๆ และอุตสาหกรรมวิดีโอ AI ยืนอยู่ตรงไหนในเช้าวันถัดมา

Gemini Omni: หัวข้อที่ไม่มีใครคาดเดา

ประกาศที่มีผลกระทบมากที่สุดคือ Gemini Omni — ซีรีส์โมเดลใหม่ที่ Google อธิบายว่าเป็นระบบสร้างมัลติโมดอลรวมศูนย์แท้จริงระบบแรกของบริษัท ขณะที่ไลน์อัปก่อนหน้านี้ของ Google แยกความสามารถระหว่าง Veo (วิดีโอ), Imagen (ภาพ) และระบบอื่น ๆ ที่เชื่อมโยงกัน Omni จัดการการสร้างข้อความ ภาพ เสียง และวิดีโอแบบเนทีฟในโมเดลเดียว

โมเดลสาธารณะแรกในกรอบ Omni คือ Omni Flash รับอินพุตข้อความ ภาพ และเสียงที่รวมกัน และส่งออกวิดีโอภาพยนตร์สั้นที่มีเสียงซิงโครไนซ์ Google สาธิตผู้ใช้อัปโหลดภาพนิ่ง พูดคำสั่งออกเสียง และได้รับฉากที่เคลื่อนไหวกลับมาพร้อมเสียงเนทีฟที่ตอบสนองต่อทิศทางที่พูด การแก้ไขเป็นแบบสนทนา — ปรับคลิปโดยพูดว่าจะเปลี่ยนอะไร แทนที่จะเขียน prompt ใหม่และสร้างใหม่จากศูนย์

สามสิ่งทำให้ Omni แตกต่างเชิงกลยุทธ์จากสายเลือด Veo:

  • โมเดลเดียว ไม่ใช่สแต็ก Veo 3 มีเสียงเนทีฟอยู่แล้ว แต่สแต็กเชิงสร้างสรรค์ที่กว้างกว่าของ Google ยังพึ่งพาการเชื่อมโยงโมเดลแยกสำหรับการสร้างภาพ การผลิตเสียง และการแก้ไข Omni พับห่วงโซ่นั้น นัยเชิงกลยุทธ์คือ Google เชื่อว่าการก้าวกระโดดด้านคุณภาพครั้งต่อไปมาจากการฝึกร่วมข้ามโมดอลลิตี ไม่ใช่จากการขยายโมเดลเฉพาะวิดีโอต่อไป
  • การสร้างที่ยึดโลกเป็นพื้นฐาน Demis Hassabis วางตำแหน่ง Omni ว่าสร้างต่อยอดจากงานโมเดลโลกของ Google DeepMind ข้อเสนอคือ Omni สร้างวิดีโอด้วยความสอดคล้องเชิงพื้นที่ เวลา และฟิสิกส์ที่แข็งแกร่งขึ้น เนื่องจากโมเดลพื้นฐานมีการแสดงโลกภายในที่สมบูรณ์กว่า ผลลัพธ์จะพิสูจน์สิ่งนี้ในทางปฏิบัติหรือไม่เป็นคำถามที่เราจะวัดในไตรมาสหน้า
  • การแก้ไขในฐานะความสามารถระดับชั้นหนึ่ง Omni ถูกวางตำแหน่งไม่ใช่แค่เป็นเครื่องสร้างแต่เป็นเครื่องตัดต่อ การปรับเปลี่ยนแบบสนทนา การสลับฉาก และการดำเนินการสไตล์รีมิกซ์เป็นส่วนหนึ่งของพื้นผิวผลิตภัณฑ์ ไม่ใช่เลเยอร์ภายนอก นี่คือการเปลี่ยนแปลงที่มีความหมายในปรัชญาผลิตภัณฑ์ที่คู่แข่งจะต้องตอบสนอง

สิ่งที่ Omni ขณะนี้ยังไม่ทำ: รูปแบบยาว Omni Flash เป็นรูปแบบสั้น และ Google ระบุชัดเจนว่าเวิร์กโฟลว์การผลิตที่ยาวและซับซ้อนกว่ามีการวางแผนแต่ยังไม่ได้เปิดตัว ใครที่หวังการสร้างเรื่องเล่า 60 วินาทีในครั้งเดียวยังต้องรอ

Gemini Spark: เอเจนต์ส่วนตัว 24/7 ในคลาวด์

หาก Omni เป็นหัวข้อที่นักวิจารณ์ส่วนใหญ่อ่านผิด Spark คือประกาศที่ถูกประเมินค่าต่ำที่สุด

Gemini Spark เป็นเอเจนต์ AI ส่วนตัวที่อยู่บน VM ของ Google Cloud โดยเฉพาะ ทำงานต่อเนื่อง และทำงานแทนคุณข้ามผลิตภัณฑ์ Google และรายการบริการของบริษัทอื่นที่กำลังขยายผ่าน Model Context Protocol (MCP) คำอธิบายผลิตภัณฑ์ในการกรอบของ Google เอง: เอเจนต์ที่สามารถ "จองร้านอาหาร สั่ง Instacart และร่างคำตอบกล่องจดหมายของคุณขณะที่คุณนอนหลับ"

ความสำคัญเชิงกลยุทธ์ยากที่จะประเมินสูงเกินไป เป็นเวลาสองปี เรื่องราว AI สำหรับผู้บริโภคของ Google คือ Gemini ในฐานะแชทบอท Spark คือ Google บอกอย่างชัดเจนว่าแชทบอทเป็นกรอบที่ผิด — กรอบที่ถูกคือเอเจนต์อิสระที่ทำงานข้ามแอปพลิเคชันและเวลา เอเจนต์อ่านกล่องจดหมายของคุณ ดำเนินการในเครื่องมือของคุณ วางแผนข้ามบริการ และรายงานกลับ ผู้ใช้อธิบายผลลัพธ์; Spark จัดการการดำเนินการ

นี่คือทฤษฎีเดียวกันที่อุตสาหกรรมวิดีโอ AI โต้แย้งกันมาตลอดปีที่ผ่านมา นำมาประยุกต์ใช้กับผลิตภาพทั่วไป เลเยอร์เอเจนต์ไม่ใช่เดิมพันตำแหน่งของสตาร์ทอัพอีกต่อไป ตอนนี้มันคือเดิมพันตำแหน่งของ Google

การกำหนดราคาสำคัญที่นี่ Spark ถูกล็อกอยู่หลังแพ็กเกจ AI Ultra ใหม่ 100 ดอลลาร์/เดือน และจะเปิดให้ใช้แบบเบต้าสำหรับสมาชิกในสหรัฐฯ สัปดาห์หน้า เพียงราคาก็ส่งสัญญาณว่า Google เชื่อว่ามีกลุ่มผู้ใช้ที่มีนัยสำคัญที่เต็มใจจ่ายเก้าเท่าของแพ็กเกจ Gemini Pro 11 ดอลลาร์เพื่อให้ได้เอเจนต์ที่ทำสิ่งต่าง ๆ ได้จริง

Gemini 3.5: การอัปเดตโมเดลพื้นฐาน

ใต้ประกาศ Omni และ Spark คือการรีเฟรชโมเดลพื้นฐาน Gemini 3.5 Flash เปิดตัวเมื่อวานข้ามแอป Gemini, Search, Antigravity และ Gemini API คำกล่าวอ้างของ Google: ดีกว่า Gemini 3.1 Pro ใน benchmark โค้ดดิ้ง, agentic และมัลติโมดอล ขณะที่ทำงานที่ความเร็วโทเค็นเอาต์พุตประมาณ 4 เท่าของโมเดล frontier ที่เทียบเคียงได้

Gemini 3.5 Pro ได้รับการประกาศแต่ยังไม่พร้อมใช้งานทั่วไป กำลังทดสอบและเปิดตัวเดือนหน้า

รูปแบบข้าม Flash, Pro, Omni และ Spark สอดคล้อง: ผลิตภัณฑ์ทุกตัวที่ Google ประกาศใน I/O สร้างบนเส้นทางความสามารถ agentic การติดตามคำสั่งเร็วขึ้น บริบทมีประสิทธิภาพยาวขึ้น การใช้เครื่องมือดีขึ้น และการดำเนินการหลายขั้นตอนที่น่าเชื่อถือมากขึ้น เลเยอร์โมเดลกำลังถูกสร้างเพื่อให้บริการเลเยอร์เอเจนต์ด้านบน

Antigravity 2.0: เรื่องราวสำหรับนักพัฒนา

Antigravity คือแพลตฟอร์มพัฒนาเอเจนต์ของ Google เมื่อวานได้รับการอัปเกรด 2.0 ที่เน้นการประสาน — ให้นักพัฒนาประกอบ จัดตารางเวลา และดูแลเอเจนต์หลายตัวที่โต้ตอบกันและกับเครื่องมือภายนอก

ความเกี่ยวข้องสำหรับวิดีโอ AI เป็นทางอ้อมแต่เป็นจริง ในขณะที่เครื่องมือวิดีโอ AI จำนวนมากขึ้นย้ายจาก wrapper โมเดลเดี่ยวไปสู่ pipeline ที่ประสานจริง โครงสร้างพื้นฐานพื้นฐานสำหรับการเรียกใช้ ตรวจสอบ และแก้ไขข้อบกพร่องของการประสานเหล่านั้นกลายเป็นการพึ่งพาพื้นฐาน Antigravity 2.0 คือ Google พยายามเป็นเจ้าของเลเยอร์โครงสร้างพื้นฐานนั้นในแบบเดียวกันที่เป็นเจ้าของเลเยอร์โมเดลด้านล่าง

ผู้สร้างเอเจนต์อิสระจะพึ่งพาโครงสร้างพื้นฐานของ Google หรือสร้างเองเป็นหนึ่งในคำถามเปิดที่น่าสนใจที่เกิดขึ้นจากคีย์โน้ตนี้ คำตอบกำหนดว่า Google จะจับเศรษฐกิจเอเจนต์ได้มากแค่ไหนเทียบกับสิ่งที่ยังคงเปิดอย่างแท้จริง

แพ็กเกจ AI Ultra 100 ดอลลาร์: รีเซ็ตเพดานราคา

Google AI Ultra ตอนนี้เริ่มที่ 100 ดอลลาร์ต่อเดือน โดยมีระดับสูงกว่าราคา 200 ดอลลาร์ แพ็กเกจ Ultra ก่อนหน้านี้คือ 250 ดอลลาร์ ระดับเริ่มต้นใหม่รวมการเข้าถึงเบต้า Gemini Spark, ขีดจำกัดการใช้แอป Gemini 5 เท่าของแพ็กเกจ Pro 20 ดอลลาร์, พื้นที่จัดเก็บคลาวด์ 20TB และ YouTube Premium

การอ่านเชิงกลยุทธ์ตรงไปตรงมา: Google กำหนดราคา AI พรีเมียมสำหรับผู้บริโภคอย่างก้าวร้าวเพื่อจับ early adopter ที่จะกำหนดว่าผลิตภัณฑ์เอเจนต์รู้สึกอย่างไร ที่ 100 ดอลลาร์/เดือน Spark ตอนนี้แข่งขันโดยตรงกับระดับสูงของ ChatGPT Pro และแพ็กเกจผู้บริโภค Claude คุณสมบัติเอเจนต์เป็นตัวสร้างความแตกต่าง — และเป็นคุณสมบัติที่คู่แข่งจะต้องเปิดตัวเวอร์ชันภายใน 12 เดือนข้างหน้าหรือยอมแพ้หมวดเอเจนต์ผลิตภาพ

สำหรับครีเอเตอร์และผู้ดำเนินการ คำถามที่เกี่ยวข้องคือ 100 ดอลลาร์/เดือนสำหรับเอเจนต์ส่วนตัวเร่งงานอย่างมีนัยสำคัญหรือไม่ คำตอบเบื้องต้นที่ตรงไปตรงมา: ขึ้นอยู่กับว่าเบต้าของ Spark จะตอบสนองเดโมหรือไม่ทั้งหมด เดโมก็คือเดโม เราจะรู้ใน 90 วัน

Android XR และ Project Aura: พื้นผิวฮาร์ดแวร์

Google ยังเปิดตัวอุปกรณ์ "แว่นตาอัจฉริยะ" ใหม่ รวมถึง Project Aura แว่นตาอัจฉริยะระดับ XR ที่พัฒนาร่วมกับ Xreal มีอย่างน้อยสามพันธมิตรแว่นตาอัจฉริยะที่เปิดตัวในปีนี้ วาง Google ไว้ระหว่าง Ray-Bans ของ Meta ที่เน้นเสียงและเฮดเซ็ต XR เต็มรูปแบบ

มุม AI: เหล่านี้ขับเคลื่อนด้วย Gemini บริบทภาพสด การโต้ตอบด้วยเสียง และการกระทำ agentic — ทั้งหมดสวมใส่ได้ สำหรับวิดีโอ AI ผลกระทบเป็นทางปลายน้ำแต่จริง กล้องที่สวมใส่ได้พร้อมบริบท Gemini กลายเป็นอุปกรณ์อินพุตถาวรสำหรับการสร้างวิดีโอ ทั้งสำหรับการจับภาพอ้างอิงและการแก้ไขสดในขณะเคลื่อนที่ เราอยู่ห่าง 18 เดือนจากที่สิ่งนี้สำคัญสำหรับเวิร์กโฟลว์การผลิต เราอยู่ห่างศูนย์เดือนจากที่สิ่งนี้สำคัญสำหรับเดโมผู้บริโภค

Android 17: OS ในฐานะเลเยอร์อัจฉริยะ

การอัปเดต Android ของ Sameer Samat วางตำแหน่ง OS เองว่าเปลี่ยนจาก "ระบบปฏิบัติการเป็นระบบอัจฉริยะ" กรอบ — Gemini เข้าใจบริบทข้ามแอป คาดการณ์ความต้องการ และดำเนินการในนามของผู้ใช้ — เป็นทฤษฎีเลเยอร์เอเจนต์เดียวกันที่นำไปใช้กับแพลตฟอร์มมือถือ

คุณสมบัติเฉพาะมีความสำคัญน้อยกว่ากรอบ Google มุ่งมั่นต่ออนาคตที่เลเยอร์ OS และเลเยอร์เอเจนต์ยุบลงเป็นสแต็กเดียว ทั้งหมดทำงานบนโมเดลพื้นฐาน Gemini สำหรับนักพัฒนา นี่หมายถึงการออกแบบแอปที่รับรู้เอเจนต์ไม่ใช่รูปแบบทางเลือกอีกต่อไป มันคือสมมติฐานพื้นฐานที่ Google กำลังสร้างแพลตฟอร์มรอบ ๆ

สิ่งที่ไม่ได้เปิดตัว: การไม่ปรากฏของ Veo 4

ประกาศที่คาดหวังที่ถูกจับตามากที่สุดที่ไม่เกิดขึ้น: Veo 4 ไม่มีการเปิดตัว Veo 4, ไม่มีไทม์ไลน์ Veo 4 และไม่มีการยืนยันชัดเจนว่า Veo กำลังถูกยกเลิกเพื่อสนับสนุนสาย Omni

การอ่านที่น่าจะเป็นไปได้มากที่สุด: Google กำลังรวมความพยายามวิดีโอสร้างสรรค์ภายใต้ Omni แทนที่จะดำเนินการพัฒนา Veo คู่ขนาน Omni Flash ถูกวางตำแหน่งเป็นจุดเริ่มต้นใหม่ Veo 3.1 ยังคงเป็นตัวเลือกระดับการผลิตสำหรับกรณีการใช้งานที่ Omni Flash ยังไม่ครอบคลุม — โดยเฉพาะการสร้างช็อตเดียวที่ยาวขึ้น เอาต์พุต 4K และความสอดคล้องของตัวละครผ่าน ID-embedding ซึ่งไม่มีตัวใดที่ Omni Flash รองรับในปัจจุบัน

สำหรับอุตสาหกรรมวิดีโอ AI ที่กว้างขึ้น นี่คือการพลิกผันที่มีความหมาย สิบแปดเดือนของการสนทนา "Veo จะทำอะไรต่อ" ถูกแทนที่ด้วย "Omni คืออะไร" ผู้ดำเนินการที่มีระบบอัตโนมัติเฉพาะ Veo ต้องประเมินว่าจะรอให้ Omni เติบโตในรูปแบบยาว หรือคงการผลิตบน Veo 3.1 ในอนาคตอันใกล้ น่าจะเป็นทั้งคู่คู่ขนาน บนประเภทเนื้อหาที่แตกต่างกัน

สิ่งนี้มีความหมายอย่างไรสำหรับผู้ดำเนินการวิดีโอ AI

ถอยหลังจากประกาศแต่ละรายการ สามสิ่งเปลี่ยนแปลงเมื่อวานที่จะกำหนดวิดีโอ AI สำหรับปีถัดไป

ประการแรก กลยุทธ์โมเดลกลายเป็นยุ่งเหยิงในรูปแบบที่เป็นประโยชน์ Omni เป็นเดิมพันมัลติโมดอลรวมศูนย์ แต่ Omni Flash เป็นรูปแบบสั้นเท่านั้น Veo 3.1 ยังคงทำงานหนักสำหรับคลิปยาวและความละเอียดสูง pipeline การผลิตจริงจะใช้ทั้งคู่ จัดเส้นทางระหว่างพวกเขา และสลับแบบไดนามิกขณะที่ Omni เติบโต เลเยอร์เอเจนต์คือที่ที่ตรรกะการจัดเส้นทางนั้นอาศัยอยู่

ประการที่สอง การคิดเลเยอร์เอเจนต์ตอนนี้เป็นฉันทามติ Spark คือ Google พูดดัง ๆ ว่ากรอบแชทบอทเป็นขั้นตอนเปลี่ยนผ่านและจุดหมายปลายทางคือเอเจนต์อิสระ ทีมผลิตภัณฑ์ AI ของผู้บริโภคและองค์กรทุกทีมที่กำลังถกเถียงว่าจะสร้าง "ผู้ช่วย" หรือ "เอเจนต์" ได้รับคำตอบที่ตกลงแล้ว เลเยอร์เอเจนต์คือที่ที่การแข่งขันย้ายไป

ประการที่สาม การแก้ไขแบบสนทนาเปลี่ยนเวิร์กโฟลว์ของครีเอเตอร์ การเน้นการแก้ไขในแชทของ Omni — ปรับคลิปโดยอธิบายว่าจะเปลี่ยนอะไร — พับสิ่งที่เคยเป็นกระบวนการสองขั้นตอน สร้างแล้วแก้ไข สำหรับครีเอเตอร์วิดีโอ AI นี่คือการลดความซับซ้อน UX ที่มีความหมายซึ่งคู่แข่งคาดว่าจะตามให้ทัน pipeline ของ Genra รองรับการทำซ้ำแบบสนทนาอยู่แล้ว คาดว่าทุกแพลตฟอร์มวิดีโอ AI ที่จริงจังจะเปิดตัวเวอร์ชันของสิ่งนี้ภายในหกเดือน

สิ่งที่ Genra ทำต่อไป

บันทึกจริงใจสองสามข้อเกี่ยวกับที่ Genra จะไปจากที่นี่

Omni Flash จะถูกผสานรวมทันทีที่พร้อมใช้งานผ่าน Gemini API เลเยอร์เอเจนต์ที่ Genra สร้างถูกออกแบบให้เป็นโมเดล-อะกnostic อย่างแม่นยำเพื่อให้การเพิ่มเช่น Omni กลายเป็นการเปลี่ยนแปลงแบ็กเอนด์ ไม่ใช่การเปลี่ยนแปลงเวิร์กโฟลว์ ผู้ใช้จะเห็นเอาต์พุตรูปแบบสั้นที่ดีขึ้นเมื่อตรรกะการจัดเส้นทางเริ่มเลือก Omni Flash สำหรับช็อตที่ทำได้ดีที่สุด กรณีการใช้งานรูปแบบยาว 4K และความสอดคล้องสูงยังคงทำงานบน Veo และ Seedance

การกรอบของ Spark ในฐานะเอเจนต์คลาวด์ 24/7 เป็นการตรวจสอบที่ใกล้ที่สุดที่เราจะขอได้สำหรับทฤษฎีเลเยอร์เอเจนต์ Genra คือเอเจนต์เฉพาะโดเมนสำหรับการผลิตวิดีโอ Spark เป็นเอเจนต์เอนกประสงค์สำหรับผลิตภาพส่วนบุคคล ทั้งสองอยู่ร่วมกันได้สบาย — ในแบบเดียวกับที่เอเจนต์ CRM และเอเจนต์โค้ดดิ้งอยู่ร่วมกับผู้ช่วยผลิตภาพทั่วไป

กรอบการแข่งขันที่ใหญ่กว่า: เมื่อ Google ตอนนี้มุ่งมั่นต่อเลเยอร์เอเจนต์ในระดับแพลตฟอร์ม คำถามสำหรับสตาร์ทอัพวิดีโอ AI ทุกแห่งไม่ใช่ "เอเจนต์คืออนาคตหรือไม่" อีกต่อไป — นั่นได้ข้อสรุปแล้ว คำถามคือเอเจนต์เฉพาะโดเมนใดที่กลายเป็นตัวเลือกที่เชื่อถือได้ในหมวดของพวกเขา สำหรับวิดีโอ AI นั่นคือคำถามที่ Genra ถูกสร้างมาเพื่อตอบ

ประเด็นสำคัญ

  • Google I/O 2026 ไม่ได้เปิดตัว Veo 4 ประกาศวิดีโอหลักคือ Gemini Omni โมเดลมัลติโมดอลรวมศูนย์ที่จัดการการสร้างข้อความ ภาพ เสียง และวิดีโอในระบบเดียว โดยมี Omni Flash เป็นโมเดลสาธารณะแรก
  • Gemini Spark เอเจนต์ส่วนตัวที่อยู่บนคลาวด์ 24/7 ที่ดำเนินการข้ามผลิตภัณฑ์ Google และบริการของบริษัทอื่นที่เชื่อมต่อ MCP คือประกาศที่มีความสำคัญเชิงกลยุทธ์มากที่สุด มันมุ่งมั่น Google ต่อเลเยอร์เอเจนต์ในฐานะสมรภูมิแพลตฟอร์มถัดไป
  • Gemini 3.5 Flash เปิดตัวเมื่อวาน; Gemini 3.5 Pro กำลังทดสอบสำหรับเดือนหน้า การอัปเดตพื้นฐานทุกครั้งถูกกำหนดรอบความสามารถ agentic ไม่ใช่แค่ความฉลาด
  • AI Ultra ถูกกำหนดราคาใหม่เป็น 100 ดอลลาร์/เดือนสำหรับการเริ่มต้น (200 ดอลลาร์ระดับสูง) ลดลงจาก Ultra ก่อนหน้าที่ 250 ดอลลาร์ การเข้าถึงเบต้า Spark ถูกล็อกที่ระดับ 100 ดอลลาร์สำหรับสมาชิกสหรัฐฯ สัปดาห์หน้า
  • Antigravity 2.0 ขยายแพลตฟอร์มพัฒนาเอเจนต์ของ Google ด้วยเครื่องมือประสาน — การเคลื่อนไหวด้านโครงสร้างพื้นฐานสำหรับผู้สร้างเอเจนต์
  • Android XR และแว่นตาอัจฉริยะ Project Aura รวมถึงการกรอบ "ระบบอัจฉริยะ" ของ Android 17 ขยายทฤษฎีเอเจนต์ไปยังเลเยอร์ฮาร์ดแวร์และ OS
  • Omni Flash เป็นรูปแบบสั้นเท่านั้น Veo 3.1 ยังคงเป็นเครื่องมือผลิตสำหรับวิดีโอที่ยาวขึ้น ความละเอียดสูงขึ้น และ ID-สอดคล้อง pipeline จริงจะจัดเส้นทางระหว่างทั้งคู่
  • การแก้ไขแบบสนทนาในฐานะความสามารถระดับชั้นหนึ่งใน Omni คือการเปลี่ยนแปลงเวิร์กโฟลว์ที่คู่แข่งต้องตามให้ทันภายในหกเดือน
  • Genra ผสานรวม Omni Flash ทันทีที่การเข้าถึง API พร้อมใช้งาน โดยผู้ใช้เห็นการยกระดับคุณภาพในช็อตรูปแบบสั้นที่จัดเส้นทางอย่างเงียบ ๆ งานรูปแบบยาว 4K และวิกฤตด้านความสอดคล้องยังคงดำเนินบน Veo และ Seedance

คำถามที่พบบ่อย

Google ประกาศ Veo 4 ใน I/O 2026 หรือไม่

ไม่ ไม่มีการประกาศ Veo 4 Google แนะนำซีรีส์โมเดล Gemini Omni แทน โดยมี Omni Flash เป็นโมเดลแรกที่พร้อมใช้งานสาธารณะ การตีความที่น่าจะเป็นไปได้มากที่สุดคือ Google กำลังรวมงานวิดีโอสร้างสรรค์ภายใต้กรอบ Omni แทนที่จะดำเนินการรุ่น Veo คู่ขนาน

Gemini Omni คืออะไร

Gemini Omni เป็นซีรีส์โมเดลมัลติโมดอลรวมศูนย์ใหม่ของ Google สามารถสร้างข้อความ ภาพ เสียง และวิดีโอแบบเนทีฟจากอินพุตที่รวมกัน Omni Flash เป็นโมเดลสาธารณะแรก เน้นที่วิดีโอรูปแบบสั้นพร้อมเสียงเนทีฟซิงโครไนซ์และการแก้ไขแบบสนทนา

Gemini Spark คืออะไร

Gemini Spark เป็นเอเจนต์ AI ส่วนตัวที่อยู่บนคลาวด์ 24/7 ที่ทำงานบน VM ของ Google โดยเฉพาะ ผสานรวมกับผลิตภัณฑ์ Google และบริการของบริษัทอื่นมากกว่า 30 รายการผ่าน MCP และดำเนินการในนามของผู้ใช้ — จอง สั่ง ร่าง และจัดการงาน เปิดตัวแบบเบต้าสำหรับสมาชิก AI Ultra ของสหรัฐฯ สัปดาห์หน้า

Google AI Ultra ราคาเท่าไรในปี 2026

ระดับเริ่มต้น AI Ultra ใหม่อยู่ที่ 100 ดอลลาร์ต่อเดือน ลดลงจาก 250 ดอลลาร์ ระดับสูงกว่าราคา 200 ดอลลาร์ แพ็กเกจ 100 ดอลลาร์รวมการเข้าถึงเบต้า Gemini Spark, ขีดจำกัดการใช้แอป Gemini 5 เท่าของระดับ Pro, พื้นที่จัดเก็บคลาวด์ 20TB และ YouTube Premium

Gemini 3.5 Flash คืออะไร

Gemini 3.5 Flash เป็นโมเดลพื้นฐานระดับเร็วล่าสุดของ Google เปิดตัวเมื่อวันที่ 19 พฤษภาคม 2026 Google อ้างว่าดีกว่า Gemini 3.1 Pro ใน benchmark โค้ดดิ้ง agentic และมัลติโมดอล ขณะที่ทำงานที่ความเร็วเอาต์พุตประมาณ 4 เท่าของโมเดล frontier ที่เทียบเคียงได้ พร้อมใช้งานในแอป Gemini, Search, Antigravity และ Gemini API

Antigravity 2.0 คืออะไร

Antigravity คือแพลตฟอร์มพัฒนาเอเจนต์ของ Google รุ่น 2.0 เพิ่มเครื่องมือประสานเพื่อให้นักพัฒนาสามารถประกอบ จัดตารางเวลา และดูแลเอเจนต์หลายตัวที่โต้ตอบกัน มันมุ่งเป้าไปที่เลเยอร์โครงสร้างพื้นฐานใต้ผลิตภัณฑ์เอเจนต์

Google ประกาศอะไรเกี่ยวกับแว่นตาอัจฉริยะใน I/O 2026

Google เปิดตัวอุปกรณ์ "แว่นตาอัจฉริยะ" ระดับ Android XR ใหม่ รวมถึง Project Aura ที่พัฒนากับ Xreal มีอย่างน้อยสามพันธมิตรแว่นตาอัจฉริยะที่เปิดตัวในฤดูใบไม้ร่วงปี 2026 วาง Google ไว้ระหว่างแว่นตาที่เน้นเสียงและเฮดเซ็ต XR เต็มรูปแบบ ทั้งหมดขับเคลื่อนด้วย Gemini

Genra จะผสานรวม Gemini Omni หรือไม่

ใช่ Genra ถูกสร้างขึ้นเพื่อให้การผสานรวมโมเดลใหม่เป็นการเปลี่ยนแปลงแบ็กเอนด์แทนที่จะเป็นการเปลี่ยนแปลงเวิร์กโฟลว์ Omni Flash จะถูกเพิ่มเข้าในตรรกะการจัดเส้นทางของเอเจนต์ทันทีที่พร้อมใช้งานผ่าน Gemini API ผู้ใช้จะเห็นการปรับปรุงคุณภาพในเอาต์พุตรูปแบบสั้นโดยไม่ต้องเปลี่ยนวิธีการทำงาน

Veo 3.1 ยังพร้อมใช้งานหลัง I/O 2026 หรือไม่

ใช่ Veo 3.1 ยังคงพร้อมใช้งานผ่าน Google AI Studio และ Vertex AI ยังคงเป็นตัวเลือกระดับการผลิตสำหรับคลิปที่ยาวขึ้น เอาต์พุต 4K และกรณีการใช้งานที่ต้องการความสอดคล้องของตัวละครผ่าน ID-embedding — ความสามารถที่ Omni Flash ยังไม่รองรับ

I/O 2026 มีความหมายอย่างไรสำหรับครีเอเตอร์วิดีโอ AI

สามการเปลี่ยนแปลง ประการแรก กลยุทธ์โมเดลตอนนี้ครอบคลุม Omni สำหรับรูปแบบสั้นมัลติโมดอลรวมศูนย์ และ Veo 3.1 สำหรับรูปแบบยาวและความละเอียดสูง — pipeline จริงจะจัดเส้นทางระหว่างทั้งคู่ ประการที่สอง การคิดเลเยอร์เอเจนต์ตอนนี้เป็นฉันทามติในระดับแพลตฟอร์ม ไม่ใช่แค่เดิมพันตำแหน่งของสตาร์ทอัพ ประการที่สาม การแก้ไขแบบสนทนากำลังกลายเป็นความสามารถพื้นฐานที่เครื่องมือวิดีโอ AI ทุกตัวต้องตามให้ทัน


เกี่ยวกับผู้เขียน
Chris Sherman ครอบคลุมเทคโนโลยีวิดีโอ AI สถาปัตยกรรมเอเจนต์ และธุรกิจการผลิตเชิงสร้างสรรค์ ติดตาม @GenraAI สำหรับการรายงานต่อเนื่องของภูมิทัศน์วิดีโอ AI หลัง I/O และการพิจารณาคดี MiniMax (29 พฤษภาคม)