Googleが、ユーザーのブラウザ操作を支援するAIモデル「Project Jarvis」を開発中と海外メディアのThe Informationが報じました。
このAIは、ユーザーがChromeブラウザ上で行うさまざまなタスクを自動化することを目的としており、調査、商品購入、フライト予約といったアクションを自動で行うことができます。
Googleにとって、既に人気のあるChromeブラウザを所有していることは大きな強みであり、AIと連携することで、ユーザー体験をさらに向上させる狙いがあります。
Project Jarvisは、次世代大型言語モデル「Gemini」を基盤に動作し、画面キャプチャやインターフェース解析を通じてタスクを実行します。
このAIは、ユーザーの画面を頻繁にキャプチャし、その内容を解釈してボタンをクリックしたり、テキスト入力を行うなどの操作を繰り返すことで、ウェブ上の一般的な作業を自律的に処理します。
GoogleのAIは、消費者の日常的なブラウザ操作を対象にしており、簡単な操作を一手に引き受ける形で、ユーザーの手間を大幅に減らすことが期待されています。
競合のAnthropicが最近リリースした「Claude」も、類似の「コンピュータ使用」機能を提供していますが、こちらはソフトウェア開発者向けの支援も含む設計であるため、利用目的が異なります。
Claudeはさまざまなアプリケーション間での操作を行うのに対し、JarvisはChromeブラウザ内に特化している点が特徴です。
さらに、MicrosoftやSalesforceも同様の技術開発を進めており、デジタルエージェント分野での競争が激化しています。
しかし、Project Jarvisの開発には課題も残っています。
現時点では操作に数秒の遅延があり、パスワードやクレジットカード情報など個人データの安全な取り扱いも大きな懸念事項です。
このため、Googleは限定的なテストユーザーを対象に、年内にプロトタイプの提供を開始する予定です。
ユーザーからのフィードバックを得て、操作速度やデータ保護の強化を図る方針です。
Project Jarvisのリリースは、AIが日常的なタスクにどれだけ浸透し、私たちの生活を効率化できるかを示す一つの事例となるでしょう。
出典:Google Preps AI That Takes Over Computers — The Information