
米Googleは、Gemini API向けの新機能「URL Context」の一般提供を開始しました。この新しい機能により、開発者はAPI経由でWebページのURLを指定するだけで、コンテンツの全文をスクレイピング(データの抽出・収集)できるようになりました。
Geminiはもともと静的な知識ベースを基に動作するため、リアルタイムのインターネット情報には直接アクセスできませんでした。今回導入された「URL Context」を利用すると、指定されたウェブページの全文を解析し、詳細な情報の抽出や分析が可能になります。さらにGoogle検索機能と組み合わせることで、検索結果から発見したウェブページの内容をリアルタイムで深く分析できるため、複雑な処理を行うAIアプリケーションの開発にも役立ちます。
また、今回のアップデートでは対応するコンテンツの種類が大幅に拡大されました。PDFファイルはテキスト情報の抽出だけでなく、文書内のテーブルや構造も把握できます。画像についてもPNG、JPEG、BMP、WebPなど主要な形式に対応し、図表やグラフなどを認識・解析できるようになりました。そのほかHTMLページ、JSONやXMLといった構造化データ、CSVファイル、さらにはプレーンテキスト、RTF、CSS、JavaScriptなど多彩なファイル形式に対応しています。
今回の正式リリースに伴い、プロダクション環境での大規模運用が可能となり、選択したGeminiモデルごとに新たなレート制限と料金体系が設定されています。料金は利用したモデルにおける標準レートで、APIへの入力トークン数に応じて明確かつ予測可能な形で課金されます。
Googleが提供する開発環境「Google AI Studio」を使えば、画面右のパネルで「URL Context」をオンにしてURLとプロンプトを入力するだけで簡単に試すことが可能です。特別なプログラムや複雑な設定をする必要はありません。

実際の活用例としては、ターミナルで利用できるオープンソースのAIツール「Gemini CLI」がこのURLコンテキスト機能を使い、Webページの要約や翻訳などを提供しています。また、カスタマーサービス企業のGladly.aiは顧客企業のWebページ情報をAIエージェントに読み込ませることで、最新の製品情報やキャンペーン情報を顧客からの問い合わせに正確かつ迅速に回答できるようにしています。
この新機能によって、顧客対応のパーソナライズ、文書の比較やトレンド分析、複数のURLを参照したコンテンツ生成、コードや技術文書の解析といった、より高度で柔軟な用途が期待されています。
出典:URL context tool for Gemini API now generally available – Google Developers Blog