ChatGPT、最新モデル「o3」「o4-mini」を発表 全ツール連携のエージェント機能搭載

出典:Introducing OpenAI o3 and o4-mini | OpenAI

OpenAIは最新の推論モデル「o3」と「o4-mini」を公開しました。これらの新しいモデルは、初めてエージェント機能を搭載し、ChatGPTが提供するすべてのツールを組み合わせて使用可能になります。

新モデル「o3」は特に高度な推論能力を備え、プログラミング、数学、科学、画像認識など、多面的で複雑な課題に対応可能です。専門家による評価では、前世代の「o1」と比較して、難度の高い課題で重大なエラーが約20%減少し、コード生成競技「Codeforces」などのベンチマークでも最先端の成果を記録しました。

出典:Introducing OpenAI o3 and o4-mini | OpenAI

一方、小型モデル「o4-mini」はコスト効率を重視した設計で、数学や視覚タスクでの高速かつ高性能な処理が特徴です。特に数学競技会AIMEの2024年と2025年では、ベンチマークテストで最高成績を達成しました。

出典:Introducing OpenAI o3 and o4-mini | OpenAI

また、両モデルとも画像をチェーン・オブ・ソート(思考の連鎖)に直接組み込むことが可能であり、従来のように画像を単に認識するだけではなく、画像を解析しながら推論プロセスを進められます。

ユーザーがアップロードした画像はモデル自身が回転、拡大、トリミングなどの基本的な画像処理をネイティブで実行し、より詳細な分析を行います。これにより、経済学の問題セットを撮影した画像から段階的な解説を提示したり、手書きメモが逆さまの場合でも自動で回転させ読み取ったりするなど、高度な視覚推論を活用した具体的で迅速な回答が可能になります。

出典:Thinking with images | OpenAI

実際のデモでは、「o3」を使って、迷路を解いたり、複雑な物理の問題を解析したり、画像からイベントの日付を特定することなどに成功しています。

出典:Thinking with images | OpenAI

安全性についても大幅な改善が図られており、生物学的脅威やマルウェア生成、脱獄(jailbreak)への対策を強化。安全性トレーニングデータを一新し、外部の専門家による厳しい評価基準をクリアしています。

さらに今回、OpenAIは端末から直接使用可能な軽量のコーディングエージェント「Codex CLI」も公開しました。このツールはモデルの推論能力を最大限に引き出し、ローカル環境で迅速なコード生成や画像処理が行える仕組みです。

新モデル「o3」と「o4-mini」は、本日よりChatGPTの有料プラン(Plus、Pro、Team)利用者向けに順次提供を開始します。無料ユーザーについても、「Think」機能を通じて「o4-mini」を試すことが可能です。


出典:Introducing OpenAI o3 and o4-mini | OpenAI
出典:Thinking with images | OpenAI

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次