
Googleは最新の人工知能モデル「Gemini 2.5」を発表し、その実験的な初バージョンとなる「Gemini 2.5 Pro」を公開しました。
Gemini 2.5シリーズは、問題解決の際に人間のように段階的に思考し、推論を深めて最適な回答を導く能力を持つ「考えるAIモデル」です。
今回発表されたGemini 2.5 Proは特に数学や科学の分野で高いパフォーマンスを発揮しており、数々のベンチマークテストにおいて他のAIモデルを大幅に引き離す成績を収めています。
実際、AIモデルの性能を評価するプラットフォーム「LMArena」のリーダーボードでは、圧倒的なスコアを記録しトップに躍り出ました。

また、Gemini 2.5 Proは、数学や科学の問題を評価するベンチマーク「GPQA」や「AIME 2025」でも最先端の成績を収めました。
さらに、人類が持つ知識や推論の限界を測定するための難易度が極めて高いデータセット「Humanity’s Last Exam」においても、18.8%というこれまでで最高のスコアを達成しました。

コーディング能力についても、Gemini 2.5 Proは過去のモデルを上回る性能を誇り、視覚的に魅力的なウェブアプリの制作、エージェント型のプログラム開発、さらに既存のコードの変換や編集に秀でています。
特に、エージェントコード評価の業界標準である「SWE-Bench Verified」では、カスタムエージェント設定において63.8%のスコアを獲得し、その高度なコーディング能力を実証しています。
GoogleはGemini 2.0と比較してコーディング性能の向上に力を入れており、今後もさらなる改善が継続される予定です。
実際に、Gemini 2.5 Proが推論機能を駆使して1行のプロンプトから実行可能なコードを生成し、ビデオゲームを作成することも可能となっています。
現在、開発者向けにはGoogle AI Studioから試験的に利用可能となっており、Geminiアプリの高度なユーザーもモデル選択のドロップダウンメニューから利用できます。
今後数週間以内に、Google CloudのAIプラットフォーム「Vertex AI」でも提供が開始される予定です。