グーグル、Google I/OでGemini 3.5やGemini Sparkなどを発表

出典:Google I/O ’26 Keynote – YouTube

グーグルは5月19日(米国時間)、開発者会議「Google I/O」で、新AIモデル「Gemini 3.5」を軸に、検索、動画生成、開発者向けエージェント、スマートグラスなど幅広いAI関連サービスを発表しました。今回の発表は、単に新しい基盤モデルを投入するだけでなく、YouTube、Google検索、Geminiアプリ、開発環境、生成メディア、Android XRまでを横断して、AIを各サービスの中心に据える内容となっています。

YouTubeでは、動画を対象にした対話型検索機能「Ask YouTube」が発表されました。長尺動画とShortsを横断して、ユーザーが複雑な質問や追加質問を行える機能で、動画の内容をもとに構造化された回答を得られます。現時点では、18歳以上の米国のYouTube Premiumメンバー向けに提供されています。また、YouTube Shorts RemixとYouTube Createには、後述する「Gemini Omni」が導入され、動画の文脈を保ったまま新しい画像の挿入や映像・音声の調整が可能になります。生成コンテンツにはデジタル透かしやメタデータ、元動画へのリンクバックも付与される予定です。

生成メディア領域では、「Gemini Omni」が発表されました。Gemini Omniは、画像、音声、動画、テキスト入力を統合し、自然言語による会話型の動画編集を可能にするモデルです。物理的な整合性やキャラクターの一貫性を重視しており、Geminiアプリ、Google Flow、YouTube Shorts、YouTube Createに展開されます。AI Plus、Pro、Ultra向けにグローバル提供され、YouTube ShortsとYouTube Createでは無償で利用できる予定です。APIやエンタープライズ向け提供は、今後数週間で始まる見通しです。

開発者向けには、「Google Antigravity」の強化が示されました。Antigravity 2.0、Antigravity CLI、SDK、Enterprise integrationが発表され、複数のAIエージェントを並列に実行したり、subagentsやscheduled tasksを扱ったりできるようになります。AI Studio、Android、Firebaseなどとの統合も進められ、GoogleはGemini CLIユーザーにAntigravity CLIへの移行を推奨しています。Antigravityは、AIエージェントを設計、操作、展開するための基盤として位置づけられています。

さらに、24時間365日稼働するクラウド常駐型AIエージェント「Gemini Spark」も発表されました。Gemini Sparkは、Gemini 3.5とAntigravity harness上で動作し、Workspaceと深く統合されます。Gmail、Calendar、Gemini chatsなどの文脈をもとに、ユーザーに代わって継続的なタスクを進める設計です。MCPを通じてCanva、OpenTable、Instacartなど外部サービスとも連携する予定で、高リスク操作の前にはユーザー確認を求めます。今週trusted testersに提供され、来週には米国のAI Ultra向けにベータ提供される予定です。

Google検索では、AI Modeの既定モデルがGemini 3.5 Flashに更新されました。検索ボックス自体もAI化され、テキスト、画像、ファイル、動画、Chromeタブ入力に対応します。AI OverviewからAI Modeへ継続的に対話する導線も統合されました。Search agentsでは、Web、ニュース、SNS、金融、ショッピング、スポーツなどを24時間監視する情報エージェントが導入されます。予約代行、業者への電話代行、生成UI、ダッシュボード、トラッカー、ミニアプリ生成なども発表され、検索は情報を探す機能から、比較、監視、予約、購入支援まで担う体験へ広がります。

中核となるGeminiでは、「Gemini 3.5 Flash」が即日一般提供されました。Search AI Mode、Geminiアプリ、Antigravity、Gemini API、Android Studio、Enterpriseに横断展開され、エージェントやコーディング用途を重視したモデルとして位置づけられています。Googleは、他のfrontier modelより出力速度が4倍だと説明しています。上位モデルのGemini 3.5 Proは来月公開予定ですが、詳細仕様やAPI価格、提供地域は未指定です。Geminiアプリでは「Neural Expressive」と呼ばれる新UIも導入され、Gemini Liveがアプリ本体に統合されます。

生成メディア全体では、Google Flow、Flow Music、Google Pics、YouTube Shorts Remixなどが強化されました。Flowでは、Flow Agent、custom tools、キャラクターの一貫性、モバイルアプリ展開などが示され、Flow Musicでは曲の部分編集、カバー、ミュージックビデオ作成に対応します。Google Picsは、Nano Bananaをベースにした画像生成・編集ツールで、オブジェクト単位の編集、画像内文字の編集や翻訳、SlidesやDriveとの統合、共同編集キャンバスを提供します。あわせて、SynthID、C2PA、AI Content Detection APIなど、生成コンテンツの真正性を確認する仕組みも強化されました。

Android XR領域では、スマートグラスにあたる「Intelligent Eyewear」が発表されました。音声中心のaudio glassesと、表示機能を持つdisplay glassesの2系統があり、Geminiによる視覚質問、ナビゲーション、通話、テキスト、高品質な写真・動画、Nano Banana編集、リアルタイム翻訳などに対応します。GoogleはSamsung、Gentle Monster、Warby Parkerと共同で開発を進めており、Samsungとのスマートグラスは今秋に一部市場で提供される予定です。ただし、価格、重量、バッテリー、カメラ解像度、表示仕様などの詳細は明らかにされていません。

今回のGoogle I/Oは、Geminiを単独のAIモデルではなく、検索、動画、開発、業務、生成メディア、ウェアラブル端末をつなぐ共通基盤として展開する姿勢を示しました。Googleは、AIを既存サービスに追加する段階から、各サービスをAIエージェント前提に再構成する段階へ進んだといえます。


出典:Google I/O ’26 Keynote – YouTube

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次