OpenAI「o3-pro」提供開始 数学ベンチマークで93%の正解率を達成

OpenAIは、新たなAIモデル「o3-pro」を発表しました。このモデルは、本日からChatGPTのProおよびTeamユーザー向けに提供開始され、API経由でも利用が可能です。また、既存のモデル「o1-pro」を置き換えることになります。Enterpriseおよび教育機関向けには、来週から提供が始まる予定です。

新モデル「o3-pro」は、従来のモデル「o3(medium)」を超える高い性能が専門家の評価によって確認されています。特に科学、教育、プログラミング、データ分析、文章作成など幅広い分野で性能向上がみられました。また、評価者からは、明確さ、包括性、指示への従順性、正確性など、全般的に高評価を獲得しています。

なかでも特筆すべきなのは、数学分野における顕著な成果です。米国の数学ベンチマークテストであるAIME(American Invitational Mathematics Examination)では、93%という極めて高い正解率を記録しました。OpenAIは従来モデルから数学、科学、コーディング分野での強みを維持していますが、今回の「o3-pro」でもその強みを発揮しています。

さらに信頼性評価についても、OpenAIは従来と同様に厳格な基準を設けています。「o3-pro」では、質問に対して4回の試行すべてに正しく答えられなければ成功と見なさない「4/4 reliability」評価が実施されており、この厳しい基準をクリアしたことで高い信頼性が裏付けられました。

また「o3-pro」は、実務的な利便性を高める多彩なツールの利用が可能です。ウェブ検索やファイルの分析、画像情報の解釈やPythonを使った計算処理、さらにはユーザーの記憶に基づくパーソナライズされた応答など、幅広い用途に対応できる仕様となっています。

なお、「o3-pro」の安全性については、基盤としているモデルが従来の「o3」と同じであることから、その詳細は既存の「o3システムカード」に記載されています。ユーザーは、このシステムカードを参照して安全性や使用上の注意点を確認することが推奨されます。

あわせて読みたい
ChatGPTのOpenAI o3とは?使い方や特徴!料金と無料での制限!o4-miniとの違い ChatGPTの最新AIモデル「OpenAI o3」がついに正式公開され、ChatGPTから利用が可能となりました。 数学、コーディング、科学的推論の分野で驚異的な成果を記録しており、その特徴や性能が話題になっています。 また、同時に発表されたo4-miniとの違いや使い分けにも注目します。 この記事では、ChatGPTのOpenAI o3の特徴や使い方だけでなく、料金や無料ユーザーの制限などを紹介します。

今回のモデル刷新によって、OpenAIの提供するサービス全般がより一層高性能化し、ユーザーの多様なニーズに応えることが期待されています。


出典:https://x.com/OpenAI/status/1932530409684005048

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次