
OpenAIは、新たな推論モデル「o3-mini」を同社のAPIに追加したと発表しました。
「o1」は広範な世界知識を持ち、大規模な推論タスクに対応する一方、「o3-mini」は小規模モデルとして開発され、特にコーディングや特定用途での推論性能に優れているとされています。
両モデルとも、関数呼び出しや構造化出力に対応しており、複雑な課題にも対応できるよう推論の努力レベルを低・中・高の3段階から選択可能です。特に「o3-mini」は「o1」と比較して93%も低価格で、処理速度も大幅に高速化されています。
具体的には「o1」の利用料金が100万トークンあたり15ドルなのに対し「o3-mini」は同じ量を1.10ドルという格安で提供しています。

また「o3-mini」はストリーミングにも対応しています。
ストリーミング対応とは、AIが生成した回答をリアルタイムに少しずつ受信し、即座に処理や表示が可能な仕組みです。これにより、アプリケーションやサービスのレスポンスが迅速になり、ユーザーの待機時間が短縮されます。
両モデルは最大20万トークンのコンテキストウィンドウを持ち、最大で10万トークンまでの出力が可能です。特に「o3-mini」は、コーディングや各種推論タスクにおいて「o1」以上の性能を発揮するとされており、開発者を中心に大きな注目を集めています。