Google、「Gemini 2.5 Flash」公開 高性能かつ破格のAPIコストで競合圧倒

出典:Start building with Gemini 2.5 Flash – Google Developers Blog

米Googleは17日、最新の生成AIモデル「Gemini 2.5 Flash」のプレビュー版をリリースしました。前世代の「2.0 Flash」をベースに推論能力を大幅に強化し、高速性と低コストの両立を実現した最新モデルです。

Gemini 2.5 Flashの最大の特徴は、「ハイブリッド推論」という新たな仕組みです。この機能により、開発者はモデルの推論(思考)機能を自由にオン・オフできるほか、「思考予算(thinking budget)」という独自のパラメータで推論にかけるトークン数を最大24,576トークンまで細かく調整可能になりました。これにより、用途やコスト、応答速度に合わせた最適なパフォーマンス調整が可能となります。

特に複雑な数学問題や多段階の推論が必要なタスクにおいて、Gemini 2.5 Flashは極めて高い精度を示します。ベンチマーク評価のLMArenaで難易度が高い問題に対しても、最上位の「Gemini 2.5 Pro」に次ぐ性能を記録しました。

また、性能の高さと並んで注目すべきはその圧倒的なコスト効率です。同等性能を持つAnthropicの「Claude 3.7 Sonnet」やOpenAIの「GPT-4o」と比較して、API利用コストは大幅に安く設定されています。

出典:Start building with Gemini 2.5 Flash – Google Developers Blog

その差はClaude 3.7 Sonnetの約20分の1、表には記載されていませんがGPT-4oのAPI料金は2ドル(入力)なので、約13分の1にまで及びます。Googleはこのモデルを「最もコスト効率の良い推論モデル」と明確に位置づけており、競合モデルに対して圧倒的な価格競争力を発揮しています。

出典:Start building with Gemini 2.5 Flash – Google Developers Blog

Gemini 2.5 Flashは、プロンプトの複雑さをモデル自身が判断し、自動的に必要な思考量を調整できる仕組みも備えており、無駄なコスト増加を防ぎます。また、推論機能を完全にオフにした場合でも高速な応答を維持しつつ、従来モデルを上回る性能を実現しています。

このプレビュー版はGoogle AI StudioやVertex AI、Geminiアプリを通じて提供が開始されており、Googleは今後も本格的な一般公開に向けてさらなる改善を加えていく方針です。ユーザーは専用パラメータを用いて、各々のニーズに合った最適な設定を試すことが推奨されています。


出典:Start building with Gemini 2.5 Flash – Google Developers Blog

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次