OpenAI「o3-pro」提供開始　数学ベンチマークで93%の正解率を達成

2025年6月11日2025年8月13日

OpenAIは、新たなAIモデル「o3-pro」を発表しました。このモデルは、本日からChatGPTのProおよびTeamユーザー向けに提供開始され、API経由でも利用が可能です。また、既存のモデル「o1-pro」を置き換えることになります。Enterpriseおよび教育機関向けには、来週から提供が始まる予定です。

新モデル「o3-pro」は、従来のモデル「o3(medium)」を超える高い性能が専門家の評価によって確認されています。特に科学、教育、プログラミング、データ分析、文章作成など幅広い分野で性能向上がみられました。また、評価者からは、明確さ、包括性、指示への従順性、正確性など、全般的に高評価を獲得しています。

なかでも特筆すべきなのは、数学分野における顕著な成果です。米国の数学ベンチマークテストであるAIME（American Invitational Mathematics Examination）では、93%という極めて高い正解率を記録しました。OpenAIは従来モデルから数学、科学、コーディング分野での強みを維持していますが、今回の「o3-pro」でもその強みを発揮しています。

さらに信頼性評価についても、OpenAIは従来と同様に厳格な基準を設けています。「o3-pro」では、質問に対して4回の試行すべてに正しく答えられなければ成功と見なさない「4/4 reliability」評価が実施されており、この厳しい基準をクリアしたことで高い信頼性が裏付けられました。

また「o3-pro」は、実務的な利便性を高める多彩なツールの利用が可能です。ウェブ検索やファイルの分析、画像情報の解釈やPythonを使った計算処理、さらにはユーザーの記憶に基づくパーソナライズされた応答など、幅広い用途に対応できる仕様となっています。

なお、「o3-pro」の安全性については、基盤としているモデルが従来の「o3」と同じであることから、その詳細は既存の「o3システムカード」に記載されています。ユーザーは、このシステムカードを参照して安全性や使用上の注意点を確認することが推奨されます。

今回のモデル刷新によって、OpenAIの提供するサービス全般がより一層高性能化し、ユーザーの多様なニーズに応えることが期待されています。

出典：https://x.com/OpenAI/status/1932530409684005048

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！