Google、ブラウザ操作を自動化するAIモデル「Project Jarvis」を開発中

Googleが、ユーザーのブラウザ操作を支援するAIモデル「Project Jarvis」を開発中と海外メディアのThe Informationが報じました。

このAIは、ユーザーがChromeブラウザ上で行うさまざまなタスクを自動化することを目的としており、調査、商品購入、フライト予約といったアクションを自動で行うことができます。

Googleにとって、既に人気のあるChromeブラウザを所有していることは大きな強みであり、AIと連携することで、ユーザー体験をさらに向上させる狙いがあります。

Project Jarvisは、次世代大型言語モデル「Gemini」を基盤に動作し、画面キャプチャやインターフェース解析を通じてタスクを実行します。

あわせて読みたい
GoogleのGemini(ジェミニ)とは?何ができる?使い方や料金と活用事例 2023年末に発表されたGoogleの最新AIモデルである「Gemini(ジェミニ)」は、OpenAIのAIサービス「ChatGPT」のライバル的関係にある生成AIです。 本記事では、Geminiの詳細な機能、他の生成AIであるChatGPTやBardとの比較、使い方や料金まで深く掘り下げていきます。 Geminiをまだ利用したことがない方は、ぜひこの記事を参考にしてみてください。

このAIは、ユーザーの画面を頻繁にキャプチャし、その内容を解釈してボタンをクリックしたり、テキスト入力を行うなどの操作を繰り返すことで、ウェブ上の一般的な作業を自律的に処理します。

GoogleのAIは、消費者の日常的なブラウザ操作を対象にしており、簡単な操作を一手に引き受ける形で、ユーザーの手間を大幅に減らすことが期待されています。

競合のAnthropicが最近リリースした「Claude」も、類似の「コンピュータ使用」機能を提供していますが、こちらはソフトウェア開発者向けの支援も含む設計であるため、利用目的が異なります。

あわせて読みたい
Anthropic、新機能「コンピュータ使用」とClaude 3.5 Haikuを発表 3.5 Sonnetも性能アップ Anthropicは、AIモデルのClaude 3.5 Sonnetのアップグレード版と、新しいモデルClaude 3.5 Haikuを発表しました。 これに加え、同社は新たな機能として「コンピュータ使用」という機能を導入し、開発者がAIに実際にコンピュータ操作をさせることが可能になると発表しました。 この機能は現在、公開ベータ版として提供されており、まだ実験的であるため、改善の余地があるものの、今後大幅に進化することが期待されています。

Claudeはさまざまなアプリケーション間での操作を行うのに対し、JarvisはChromeブラウザ内に特化している点が特徴です。

さらに、MicrosoftやSalesforceも同様の技術開発を進めており、デジタルエージェント分野での競争が激化しています。

しかし、Project Jarvisの開発には課題も残っています。

現時点では操作に数秒の遅延があり、パスワードやクレジットカード情報など個人データの安全な取り扱いも大きな懸念事項です。

このため、Googleは限定的なテストユーザーを対象に、年内にプロトタイプの提供を開始する予定です。

ユーザーからのフィードバックを得て、操作速度やデータ保護の強化を図る方針です。

Project Jarvisのリリースは、AIが日常的なタスクにどれだけ浸透し、私たちの生活を効率化できるかを示す一つの事例となるでしょう。


出典:Google Preps AI That Takes Over Computers — The Information

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次