Google次世代AIモデル「Gemini 2.0」シリーズを一般公開

出典:Google introduces Gemini 2.0: A new AI model for the agentic era

Googleは、長らく開発者向けにベータテストされていた次世代AIモデル「Gemini 2.0」シリーズを本日一般ユーザー向けに正式公開しました。

今回のアップデートでは、従来のGemini 1.5シリーズから大幅に進化した各モデルが、Google AI Studio、Vertex AI、さらには専用のGeminiアプリ(デスクトップ・モバイル)を通じて提供され、さまざまなシーンでの活用が期待されています。

目次

Gemini 2.0 Flash

出典:https://x.com/GoogleDeepMind/status/1887172477631049834

Gemini 2.0 Flashは、従来の1.5 Proに比べ約2倍の応答速度を実現。さらに料金体系も大幅に見直され、文脈の長さにかかわらず一律の料金設定が採用されました。

従来料金新料金
入力 $0.075 / 500,000トークン$0.10 / 1,000,000トークン
$0.15 / 128,000トークン
出力 $0.18 / 300,000トークン$0.40 / 1,000,000トークン
$0.60 / 128,000トークン

従来のGemini 1.5 Flashでは、例えば128,000トークン以内のリクエストの場合は入力が約$0.075、出力が約$0.30、プロンプトが128,000トークンを超える長い文脈の場合は、これらの料金がそれぞれ倍の約$0.15(入力)と$0.60(出力)に増加する仕組みでしたが、このシンプルな料金体系により、長文や大量データの処理時にもコスト計算が容易になりました。

Gemini 2.0 Flash-Lite

出典:https://x.com/GoogleDeepMind/status/1887172477631049834

Gemini 2.0 Flash-Liteは、Flashの技術をベースにしつつ、よりコストパフォーマンスを重視したモデルです。

Google AI StudioおよびVertex AIを通じてパブリックプレビューが開始され、より経済的なAI活用を求めるユーザーにとって魅力的な選択肢となっています。

従来の1.5 Flashと比較して、ベンチマーク上で優れた性能を示す一方、速度やコスト面では同等の水準を維持

100万トークンのコンテキストウィンドウ、マルチモーダル入力への対応、そしてテキスト出力機能が可能です。

Gemini 2.0 Pro Experimental

出典:https://x.com/GoogleDeepMind/status/1887172477631049834

Gemini 2.0 Pro Experimentalは、最高峰のモデルとして位置付けられ、以下の特徴を備えています。

従来の100万トークンから最大200万トークンにコンテキストウィンドウが拡張されました。これにより膨大なソースコードや長文ドキュメントの一括解析が可能に。

また、外部ツールの連携も可能になり、Google Searchやコード実行など、外部ツールを直接呼び出す機能が統合され、複雑なコーディングタスクや多段階の指示にも迅速かつ正確に対応。

これらの機能向上により、エンジニアリング作業や高度なデータ解析の現場で、これまでにない効率性と柔軟性が実現されます。

Gemini 2.0 Flash Thinking Experimental

出典:https://x.com/GoogleDeepMind/status/1887172477631049834

Gemini 2.0 Flash Thinking Experimentalは、従来のモデルと比較して、科学や数学といった高度な分野での問題解決能力を大幅に向上させるとともに、モデルの「思考過程」をユーザーに明示することで、回答の一貫性と説明性を高めています。

本モデルは最大1,000,000トークンの入力コンテキストに対応しており、複雑で長大なテキストの解析が可能です。これにより、複数段階にわたる指示や文脈の深い理解が求められるタスクにも柔軟に対応します。

さらに、入力データとしてテキストと画像の両方をサポートし、出力はテキスト形式で提供されます。これにより、視覚情報を含む複雑なシナリオにも柔軟に対応可能です。

加えて「2.0 Flash Thinking Experimental with apps」という新たな機能も提供しています。

これらはYouTubeやGoogleマップなどのGoogleアプリとの連携も可能となり、動画の要約や店舗情報の提示といった実用的なタスクを実行できます。

例えば、 YouTubeの人気動画に関する情報を抽出し、要約や傾向分析を実施させたり、 Googleマップを利用して、指定エリア内の店舗情報や営業時間を提示させることができるようになりました。

検索機能も活用できるので、OpenAIのDeep Researchと同様に、推論と検索を同時に行えるようになりました。

これらの機能は、現在Geminiのウェブ版およびモバイルアプリにてすべてのユーザーに展開されており、日常のさまざまなシーンでの活用が期待されます。


出典:Google introduces Gemini 2.0: A new AI model for the agentic era

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次