Google I/O 2026 정리: Veo 4는 없었지만 Gemini Omni와 Spark가 에이전트 레이어를 공식화하다
· Chris Sherman두 달 동안 AI 비디오 산업 전체가 Veo 4를 이야기했다. 출시되지 않았다. Google이 I/O 2026에서 발표한 것은 더 크고 더 이상했다: Gemini Omni라는 통합 멀티모달 모델, Spark라는 24/7 클라우드 상주 에이전트, 소비자 가격 하한을 다시 설정하는 100달러 AI Ultra 등급, 그리고 Google이 이제 에이전트 레이어를 다음 플랫폼 싸움으로 본다는 명확한 신호. 여기 전체 해설이 있다.
어제 Sundar Pichai는 Shoreline Amphitheatre 무대에 올라 AI 비디오 산업에 누구도 예상하지 못한 것을 주었다. Veo 4는 없었다. "Veo" 브랜드의 헤드라인은 전혀 없었다. 그 자리에 더 전략적으로 흥미로운 것이 있었다: Gemini Omni — 단일 시스템에서 텍스트, 이미지, 오디오, 비디오 생성을 네이티브로 처리하는 멀티모달 모델; Gemini Spark — 클라우드 VM 위에서 살고 하루 24시간 당신을 대신해 행동하는 개인 AI 에이전트; 그리고 100달러 AI Ultra 플랜을 Google 소비자 AI 베팅의 중심에 두는 가격 재구성.
이 기조연설은 앞으로 12개월 AI 비디오의 각본을 다시 썼다. 아래는 Google이 발표한 모든 것, 그것이 실제로 의미하는 바, 그리고 발표 다음 날 아침 AI 비디오 산업이 어디에 서 있는지다.
Gemini Omni: 아무도 예측하지 못한 헤드라인
가장 의미 있는 발표는 Gemini Omni — Google이 회사 최초의 진정으로 통합된 멀티모달 생성 시스템이라고 설명하는 새로운 모델 시리즈였다. Google의 이전 라인업은 Veo(비디오), Imagen(이미지) 및 기타 연결된 시스템 사이에 기능을 분리했지만, Omni는 텍스트, 이미지, 오디오, 비디오 생성을 하나의 모델에서 네이티브로 처리한다.
Omni 프레임워크의 첫 공개 모델은 Omni Flash다. 결합된 텍스트, 이미지, 오디오 입력을 받아 동기화된 사운드와 함께 짧은 시네마틱 비디오를 출력한다. Google은 사용자가 정지 이미지를 업로드하고, 음성으로 지시를 말하고, 음성 지시에 응답하는 네이티브 오디오를 가진 애니메이션 장면을 받는 시연을 보여주었다. 편집은 대화형이다 — 새 프롬프트를 작성해 처음부터 다시 생성하는 대신, 무엇을 바꿀지 말함으로써 클립을 미세 조정한다.
Omni가 Veo 계보와 전략적으로 다른 세 가지:
- 스택이 아닌 하나의 모델. Veo 3는 이미 네이티브 오디오를 가지고 있었지만, 더 광범위한 Google 크리에이티브 스택은 여전히 이미지 생성, 오디오 제작, 편집을 위해 별도의 모델을 연결하는 데 의존했다. Omni는 그 체인을 접는다. 전략적 함의는 Google이 다음 품질 도약은 모달리티 간 공동 학습에서 오며, 비디오 전용 모델을 더 스케일링하는 것에서 오는 것이 아니라고 믿는다는 것이다.
- 세계 기반 생성. Demis Hassabis는 Omni를 Google DeepMind의 세계 모델 작업 위에 구축하는 것으로 자리매김했다. 주장은 Omni가 더 풍부한 내부 세계 표현을 가진 기반 모델 때문에 더 강한 공간적, 시간적, 물리적 일관성을 가진 비디오를 생성한다는 것이다. 출력이 실제로 이를 증명하는지는 다음 분기에 벤치마킹할 질문이다.
- 일급 기능으로서의 편집. Omni는 단지 생성기가 아니라 편집기로 자리매김된다. 대화형 미세 조정, 장면 교체, 리믹스 스타일 작업은 외부 레이어가 아닌 제품 표면의 일부다. 이는 경쟁사가 대응해야 할 제품 철학의 의미 있는 전환이다.
Omni가 현재 하지 않는 것: 롱폼. Omni Flash는 숏폼이며, Google은 더 길고 더 고급의 프로덕션 워크플로우가 계획되어 있지만 아직 출시되지 않았다고 명시했다. 원샷 60초 내러티브 생성을 기대했던 사람은 여전히 기다리고 있다.
Gemini Spark: 클라우드의 24/7 개인 에이전트
Omni가 대부분의 평론가들이 잘못 읽은 헤드라인이었다면, Spark는 가장 과소평가된 발표였다.
Gemini Spark는 전용 Google Cloud VM에서 살고, 지속적으로 실행되며, Google 제품과 Model Context Protocol(MCP)을 통해 확장되는 서드파티 서비스 목록을 가로질러 당신을 대신해 행동하는 개인 AI 에이전트다. Google 자신의 프레이밍으로 제품 설명: "당신이 자는 동안 레스토랑을 예약하고, Instacart 주문을 넣고, 받은편지함 답장 초안을 작성"할 수 있는 에이전트.
전략적 의미는 과대평가하기 어렵다. 2년 동안 Google의 소비자 AI 이야기는 챗봇으로서의 Gemini였다. Spark는 Google이 챗봇이 잘못된 프레임이었다고 명시적으로 말하는 것이다 — 올바른 프레임은 애플리케이션과 시간을 가로질러 작동하는 자율 에이전트다. 에이전트는 당신의 받은편지함을 읽고, 도구에서 행동을 취하고, 서비스에 걸쳐 계획하고, 보고한다. 사용자는 결과를 설명하고, Spark는 실행을 처리한다.
이는 AI 비디오 산업이 지난 1년 동안 논쟁해 온 동일한 논지를 일반 생산성에 적용한 것이다. 에이전트 레이어는 더 이상 스타트업 포지셔닝 베팅이 아니다. 이제 Google의 포지셔닝 베팅이다.
여기서 가격이 중요하다. Spark는 새로운 월 100달러 AI Ultra 등급 뒤에 잠겨 있으며, 다음 주에 미국 구독자에게 베타로 출시된다. 가격만으로도 Google이 11달러 Gemini Pro 등급의 9배를 지불할 의향이 있는 의미 있는 사용자 인구가 실제로 일을 하는 에이전트를 얻기 위해 존재한다고 믿는다는 신호다.
Gemini 3.5: 기반 모델 업데이트
Omni와 Spark 발표 아래에는 기반 모델 새로고침이 있다. Gemini 3.5 Flash는 어제 Gemini 앱, Search, Antigravity, Gemini API 전반에 걸쳐 출시되었다. Google의 주장: 코딩, 에이전트, 멀티모달 벤치마크에서 Gemini 3.1 Pro를 능가하면서 비슷한 프론티어 모델의 출력 토큰 속도의 약 4배로 실행된다.
Gemini 3.5 Pro는 발표되었지만 아직 일반 출시되지 않았다. 테스트 중이며 다음 달에 출시된다.
Flash, Pro, Omni, Spark 전반에 걸친 패턴은 일관된다: Google이 I/O에서 발표한 모든 제품은 에이전트 능력 트랙 위에 구축되어 있다. 더 빠른 지시 따르기, 더 긴 효과적 컨텍스트, 더 나은 도구 사용, 더 신뢰할 수 있는 다단계 실행. 모델 레이어는 그 위의 에이전트 레이어에 봉사하도록 형성되고 있다.
Antigravity 2.0: 개발자 이야기
Antigravity는 Google의 에이전트 개발 플랫폼이다. 어제 오케스트레이션에 초점을 맞춘 2.0 업그레이드를 받았다 — 개발자가 서로 그리고 외부 도구와 상호작용하는 여러 에이전트를 구성, 스케줄링, 감독할 수 있게 한다.
AI 비디오와의 관련성은 간접적이지만 실재한다. 더 많은 AI 비디오 도구가 단일 모델 래퍼에서 실제 오케스트레이션된 파이프라인으로 이동함에 따라, 그러한 오케스트레이션을 실행, 모니터링, 디버깅하기 위한 기반 인프라가 근본적인 의존성이 된다. Antigravity 2.0은 Google이 그 아래의 모델 레이어를 소유하는 것과 같은 방식으로 그 인프라 레이어를 소유하려는 시도다.
독립적인 에이전트 빌더가 Google의 인프라에 의존할지 자체적으로 구축할지가 이 기조연설에서 떠오르는 가장 흥미로운 미해결 질문 중 하나다. 답이 Google이 에이전트 경제의 얼마나 많은 부분을 포착하는지 대 얼마나 많은 부분이 진정으로 개방된 채로 남는지를 결정한다.
100달러 AI Ultra 등급: 가격 하한 재설정
Google AI Ultra는 이제 월 100달러부터 시작하며, 상위 등급은 200달러다. 이전 Ultra 플랜은 250달러였다. 새로운 진입 등급에는 Gemini Spark 베타 액세스, 20달러 Pro 등급의 Gemini 앱 사용 한도의 5배, 20TB 클라우드 스토리지, YouTube Premium이 포함된다.
전략적 해석은 직설적이다: Google은 에이전트 제품이 어떻게 느껴지는지 정의할 얼리 어답터를 잡기 위해 프리미엄 소비자 AI 가격을 공격적으로 책정하고 있다. 월 100달러에서 Spark는 이제 ChatGPT Pro와 Claude 소비자 등급의 최상위와 직접 경쟁한다. 에이전트 기능이 차별화 요소다 — 그리고 경쟁사가 향후 12개월 내에 버전을 출시해야 하는 기능이며, 그렇지 않으면 생산성 에이전트 카테고리를 양보하게 된다.
크리에이터와 운영자에게 관련 질문은 월 100달러의 개인 에이전트가 작업을 의미 있게 가속화하는지 여부다. 솔직한 초기 답: 전적으로 Spark의 베타가 데모에 부응하는지에 달려 있다. 데모는 데모다. 90일 안에 알게 될 것이다.
Android XR과 Project Aura: 하드웨어 표면
Google은 Xreal과의 파트너십으로 개발된 XR 클래스 스마트 글래스인 Project Aura를 포함해 새로운 "지능형 안경" 기기도 공개했다. 적어도 세 개의 스마트 글래스 파트너십이 올해 출시되며, Google을 Meta의 오디오 우선 Ray-Bans와 완전한 XR 헤드셋 사이에 위치시킨다.
AI 각도: 이들은 Gemini로 구동된다. 라이브 시각적 컨텍스트, 음성 상호작용, 에이전트 행동 — 모두 착용 가능. AI 비디오에 대한 함의는 하류이지만 실재한다. Gemini 컨텍스트가 있는 착용형 카메라는 참조 캡처와 이동 중 라이브 편집 모두를 위한 비디오 제작의 영구 입력 장치가 된다. 프로덕션 워크플로우에 중요해지기까지 18개월이다. 소비자 데모에 중요해지기까지 0개월이다.
Android 17: 지능 레이어로서의 OS
Sameer Samat의 Android 업데이트는 OS 자체를 "운영 체제에서 지능 시스템으로" 변환되는 것으로 자리매김했다. 프레이밍 — Gemini가 앱 전반의 컨텍스트를 이해하고, 필요를 예측하고, 사용자를 대신해 행동을 취한다 — 은 모바일 플랫폼에 적용된 동일한 에이전트 레이어 논지다.
구체적인 기능은 프레이밍보다 덜 중요하다. Google은 OS 레이어와 에이전트 레이어가 하나의 스택으로 붕괴되는 미래에 헌신하고 있으며, 모두 Gemini 기반 모델에서 실행된다. 개발자에게 이는 에이전트 인식 앱 디자인이 더 이상 선택적 패턴이 아니라는 것을 의미한다; 그것은 Google이 플랫폼을 구축하는 기본 가정이다.
출시되지 않은 것: Veo 4의 부재
일어나지 않은 가장 주목받던 예상 발표: Veo 4. Veo 4 공개도, Veo 4 일정도, Veo가 Omni 라인을 위해 폐기되고 있다는 명시적 확인도 없었다.
가장 가능성 있는 해석: Google은 병렬 Veo 개발을 계속하기보다 생성 비디오 노력을 Omni 아래에 통합하고 있다. Omni Flash는 새로운 시작점으로 자리매김된다. Veo 3.1은 Omni Flash가 아직 다루지 않는 사용 사례를 위한 프로덕션 등급 옵션으로 남는다 — 특히 더 긴 단일 샷 생성, 4K 출력, ID 임베딩 캐릭터 일관성, 이 중 어느 것도 Omni Flash가 현재 지원하지 않는다.
더 광범위한 AI 비디오 산업에 이는 의미 있는 전환이다. 18개월간의 "Veo가 다음에 무엇을 할까" 대화는 "Omni는 무엇인가"로 대체되었다. Veo 특정 자동화를 가진 운영자는 Omni가 롱폼에서 성숙할 때까지 기다릴지, 아니면 가까운 미래에 Veo 3.1에 프로덕션을 유지할지 평가해야 한다. 아마도 둘 다, 병렬로, 다른 콘텐츠 유형에 대해.
이것이 AI 비디오 운영자에게 의미하는 바
개별 발표에서 한 걸음 물러나 보면, 어제 세 가지가 바뀌었고 이는 향후 1년 동안 AI 비디오를 형성할 것이다.
첫째, 모델 전략이 유용한 방식으로 더 어수선해졌다. Omni는 통합 멀티모달 베팅이지만, Omni Flash는 숏폼 전용이다. Veo 3.1은 여전히 더 긴 클립과 더 높은 해상도를 위한 무거운 작업을 한다. 실제 프로덕션 파이프라인은 둘 다 사용하고, 그 사이를 라우팅하고, Omni가 성숙함에 따라 동적으로 전환할 것이다. 그 라우팅 로직이 사는 곳이 에이전트 레이어다.
둘째, 에이전트 레이어 사고는 이제 합의다. Spark는 Google이 챗봇 프레이밍이 과도기적 단계였고 목적지는 자율 에이전트라고 큰 소리로 말하는 것이다. "어시스턴트"를 만들지 "에이전트"를 만들지 토론해 온 모든 소비자 및 기업 AI 제품 팀은 결판난 답을 받았다. 에이전트 레이어가 경쟁이 이동하는 곳이다.
셋째, 대화형 편집은 크리에이터 워크플로우를 바꾼다. 인-챗 편집에 대한 Omni의 강조 — 무엇을 바꿀지 설명하여 클립을 미세 조정 — 는 한때 생성-후-편집 2단계였던 것을 접는다. AI 비디오 크리에이터에게 이는 경쟁사가 맞춰야 할 것으로 예상되는 의미 있는 UX 단순화다. Genra의 파이프라인은 이미 대화형 반복을 지원한다; 모든 진지한 AI 비디오 플랫폼이 6개월 이내에 이것의 버전을 출시할 것으로 예상하라.
Genra가 다음에 할 일
Genra가 여기서 어디로 가는지에 대한 몇 가지 솔직한 메모.
Omni Flash는 Gemini API를 통해 제공되는 즉시 통합될 것이다. Genra가 구축해 온 에이전트 레이어는 Omni와 같은 추가가 워크플로우 변경이 아닌 백엔드 변경이 되도록 정확히 모델 비의존적으로 설계되었다. 사용자는 라우팅 로직이 가장 잘하는 샷에 대해 Omni Flash를 선택하기 시작함에 따라 더 나은 숏폼 출력을 보게 될 것이다. 롱폼, 4K, 고일관성 사용 사례는 계속 Veo와 Seedance에서 실행된다.
24/7 클라우드 상주 에이전트로서의 Spark 프레이밍은 우리가 에이전트 레이어 논지에 대해 요청할 수 있었던 가장 가까운 검증이다. Genra는 비디오 제작을 위한 도메인 특화 에이전트다. Spark는 개인 생산성을 위한 범용 에이전트다. 둘은 편안하게 공존한다 — CRM 에이전트와 코딩 에이전트가 일반 생산성 어시스턴트와 공존하는 것과 같은 방식으로.
더 큰 경쟁 프레임: Google이 이제 플랫폼 레벨에서 에이전트 레이어에 헌신함에 따라, 모든 AI 비디오 스타트업에 대한 질문은 더 이상 "에이전트가 미래인가"가 아니다 — 그것은 결판났다. 질문은 어떤 도메인 특화 에이전트가 자신의 카테고리에서 신뢰받는 선택이 되는가다. AI 비디오에 대해 그것이 Genra가 답하기 위해 구축된 질문이다.
핵심 요점
- Google I/O 2026은 Veo 4를 출시하지 않았다. 헤드라인 비디오 발표는 Gemini Omni — 단일 시스템에서 텍스트, 이미지, 오디오, 비디오 생성을 처리하는 통합 멀티모달 모델이며, Omni Flash가 첫 공개 모델이다.
- Google 제품과 MCP 연결 서드파티 서비스에 걸쳐 행동하는 24/7 클라우드 상주 개인 에이전트인 Gemini Spark가 전략적으로 가장 의미 있는 발표다. Google을 다음 플랫폼 싸움으로서의 에이전트 레이어에 헌신시킨다.
- Gemini 3.5 Flash는 어제 출시되었다; Gemini 3.5 Pro는 다음 달을 위해 테스트 중이다. 모든 기반 업데이트는 단순한 지능이 아닌 에이전트 능력 주위에 프레임되었다.
- AI Ultra는 진입 100달러/월(최상위 200달러)로 재가격화되었으며, 이전 250달러 Ultra에서 인하되었다. Spark 베타 액세스는 다음 주 미국 구독자의 100달러 등급에 게이트된다.
- Antigravity 2.0은 오케스트레이션 도구로 Google의 에이전트 개발 플랫폼을 확장한다 — 에이전트 빌더를 위한 인프라 수.
- Android XR 및 Project Aura 스마트 글래스, 그리고 Android 17의 "지능 시스템" 프레이밍이 에이전트 논지를 하드웨어 및 OS 레이어로 확장한다.
- Omni Flash는 숏폼 전용이다. Veo 3.1은 더 길고, 더 높은 해상도, ID 일관성 비디오를 위한 프로덕션 도구로 남는다. 실제 파이프라인은 둘 사이를 라우팅할 것이다.
- Omni에서 일급 기능으로서의 대화형 편집은 경쟁사가 6개월 이내에 맞춰야 할 워크플로우 전환이다.
- Genra는 API 액세스가 제공되는 즉시 Omni Flash를 통합하며, 사용자는 라우팅된 숏폼 샷에서 품질 향상을 조용히 보게 된다. 롱폼, 4K, 일관성이 중요한 작업은 계속 Veo와 Seedance에서 실행된다.
자주 묻는 질문
Google이 I/O 2026에서 Veo 4를 발표했나요?
아니요. Veo 4 발표는 없었습니다. Google은 대신 Gemini Omni 모델 시리즈를 도입했으며, Omni Flash가 첫 공개 이용 가능 모델입니다. 가장 가능성 있는 해석은 Google이 병렬 Veo 세대를 계속하기보다 Omni 프레임워크 아래에 생성 비디오 작업을 통합하고 있다는 것입니다.
Gemini Omni는 무엇인가요?
Gemini Omni는 결합 입력에서 텍스트, 이미지, 오디오, 비디오를 네이티브로 생성할 수 있는 Google의 새로운 통합 멀티모달 모델 시리즈입니다. Omni Flash는 동기화된 네이티브 오디오와 대화형 편집을 갖춘 숏폼 비디오에 초점을 맞춘 첫 공개 모델입니다.
Gemini Spark는 무엇인가요?
Gemini Spark는 전용 Google VM에서 실행되고, MCP를 통해 Google 제품 및 30개 이상의 서드파티 서비스와 통합되며, 사용자를 대신해 행동을 취하는 24/7 클라우드 상주 개인 AI 에이전트입니다 — 예약, 주문, 초안 작성, 작업 관리. 다음 주에 미국 AI Ultra 구독자에게 베타로 출시됩니다.
2026년 Google AI Ultra 가격은 얼마인가요?
새로운 AI Ultra 진입 등급은 월 100달러로, 이전 250달러에서 인하되었습니다. 상위 등급은 200달러입니다. 100달러 플랜에는 Gemini Spark 베타 액세스, Pro 등급의 Gemini 앱 사용 한도의 5배, 20TB 클라우드 스토리지, YouTube Premium이 포함됩니다.
Gemini 3.5 Flash는 무엇인가요?
Gemini 3.5 Flash는 2026년 5월 19일에 출시된 Google의 최신 빠른 등급 기반 모델입니다. Google은 코딩, 에이전트, 멀티모달 벤치마크에서 Gemini 3.1 Pro를 능가하면서 비교 가능한 프론티어 모델의 출력 속도의 약 4배로 실행된다고 주장합니다. Gemini 앱, Search, Antigravity, Gemini API에서 사용 가능합니다.
Antigravity 2.0은 무엇인가요?
Antigravity는 Google의 에이전트 개발 플랫폼입니다. 2.0 릴리스는 개발자가 상호작용하는 여러 에이전트를 구성, 스케줄링, 감독할 수 있도록 오케스트레이션 도구를 추가합니다. 에이전트 제품 아래의 인프라 레이어를 겨냥합니다.
Google이 I/O 2026에서 스마트 글래스에 대해 무엇을 발표했나요?
Google은 Xreal과 함께 개발된 Project Aura를 포함해 새로운 Android XR 클래스 "지능형 안경" 기기를 공개했습니다. 적어도 세 개의 스마트 글래스 파트너십이 2026년 가을에 출시되며, Google을 오디오 우선 안경과 완전한 XR 헤드셋 사이에 위치시킵니다. 모두 Gemini로 구동됩니다.
Genra는 Gemini Omni를 통합할 건가요?
예. Genra는 새 모델 통합이 워크플로우 변경이 아닌 백엔드 변경이 되도록 구축되었습니다. Omni Flash는 Gemini API를 통해 제공되는 즉시 에이전트의 라우팅 로직에 추가됩니다. 사용자는 작업 방식을 변경하지 않고 숏폼 출력의 품질 향상을 보게 됩니다.
I/O 2026 이후에도 Veo 3.1을 사용할 수 있나요?
예. Veo 3.1은 Google AI Studio와 Vertex AI를 통해 계속 사용할 수 있습니다. 더 긴 클립, 4K 출력, ID 임베딩을 통한 캐릭터 일관성이 필요한 사용 사례를 위한 프로덕션 등급 옵션으로 남습니다 — Omni Flash가 아직 지원하지 않는 기능입니다.
I/O 2026이 AI 비디오 크리에이터에게 의미하는 바는?
세 가지 전환. 첫째, 모델 전략은 이제 숏폼 통합 멀티모달용 Omni와 롱폼 및 고해상도용 Veo 3.1에 걸쳐 있습니다 — 실제 파이프라인은 둘 사이를 라우팅할 것입니다. 둘째, 에이전트 레이어 사고는 이제 단순한 스타트업 포지셔닝 베팅이 아닌 플랫폼 레벨에서 합의입니다. 셋째, 대화형 편집이 모든 AI 비디오 도구가 맞춰야 할 기본 기능이 되고 있습니다.
저자 소개
Chris Sherman은 AI 비디오 기술, 에이전트 아키텍처, 크리에이티브 제작의 비즈니스를 다룹니다. I/O 이후 AI 비디오 풍경과 MiniMax 청문회(5월 29일)에 대한 계속되는 보도는 @GenraAI를 팔로우하세요.