OpenAIは、開発者向けに「o1 API」の一般公開を発表しました。
今回のリリースでは、コード生成や顧客サポート、財務分析などの分野に応用が期待される強力な機能が追加され、アプリケーション開発をさらに支援します。
ただし、o1 APIはすべての開発者に対して一般公開されたわけではなく、まずは使用量が多い「ティア5」の開発者から順次展開され、今後数週間をかけて他の開発者にも公開される予定です。
o1 APIは、関数呼び出し、構造化出力、開発者メッセージといった新機能を搭載しています。
特に、構造化出力機能はJSONスキーマに基づく正確なデータフォーマット生成を可能にし、アプリケーション開発を簡素化します。
また、「Reasoning Effort(推論プロセスの調整)」 という新たなパラメータが導入され、モデルが「思考」に費やす時間を制御することで、問題の難易度に応じた計算リソースの最適化が可能になりました。
It's faster than `o1-preview`, using 60% fewer reasoning tokens on average.
— OpenAI Developers (@OpenAIDevs) December 17, 2024
We've also added a new `reasoning_effort` parameter, which lets you control how long it thinks before answering.
The snapshot we're shipping today is `o1-2024-12-17`—see how it performs: pic.twitter.com/hEbFNvvbWE
さらに、o1 APIでは推論トークンの使用量が平均60%削減されており、その結果、処理速度が向上しています。
ただし、高速化の具体的な度合いについては明示されていません。
視覚入力のサポートも追加され、画像データの解析が可能となったことで、製造業や科学分野をはじめとする新たな活用シーンが広がることが期待されています。
We're bringing OpenAI o1 to the API. We're rolling out access to developers on usage tier 5 starting today, and rollout will continue over the next few weeks.
— OpenAI Developers (@OpenAIDevs) December 17, 2024
o1 supports:
⚙️ Function calling
🗂️ Structured Outputs
👀 Vision
📝 Developer messages
🧠 Reasoning effort pic.twitter.com/Ax8TT0IRke
同時に、OpenAIはリアルタイムAPIの改良も発表しました。
WebRTC対応により、低遅延の音声アプリケーション開発が可能となり、AIを活用した音声アシスタントやリアルタイム対話型の体験を容易に構築できるようになりました。
また、音声トークンの料金が最大60%引き下げられるなど、コスト面でも大きな改善が行われています。
さらに、OpenAIは開発者向けのカスタマイズ機能として「Preference Fine-Tuning(選好微調整)」を導入しました。
教師あり学習では効果が限定的だったケースでも、Preference Fine-Tuningによって精度向上が見込める可能性があります。
例えば、金融分析AIの事例では、教師あり学習では性能改善が見られなかった一方で、Preference Fine-Tuningを利用することで内部ベンチマークの精度が向上したことが紹介されました。
開発者体験の向上にも注力しており、GoおよびJava用のSDKについては、既に提供されているSDKの利便性が改めて強調されました。
これにより、幅広いプログラミング言語でOpenAIのAPIを活用できることが再確認されています。
加えて、APIキー取得フローの簡素化により、新規ユーザーでも数秒で利用を開始できる仕組みが構築されています。
OpenAIは、これらの新機能やツールの提供を通じて、開発者がより柔軟かつ効率的にAIツールを活用し、革新的なアプリケーションを生み出せる環境を整えています。
出典:Dev Day Holiday Edition—12 Days of OpenAI: Day 9 – YouTube