OpenAI、新技術「強化学習型ファインチューニング」で特化型AI開発を支援する研究プログラムを開始

出典:12 Days of OpenAI | OpenAI

OpenAIは、AI技術の進化を紹介する「12日間連続ライブ配信」の2日目として、新たな研究プログラムの発表を行いました。

このプログラムでは、最新技術である「強化学習型ファインチューニング(Reinforcement Fine-Tuning, RFT)」を用いたモデルカスタマイズが可能となり、特定分野に特化したAIモデルの開発を支援します。

RFTは、モデルが回答を導き出す際に思考する時間を増やしつつ、類似の問題に対してどのように推論を行うかを強化することで、より適切で高品質な回答を提供できるようにする技術です。

これにより、比較的小規模であっても高品質なデータセットを活用することで、モデルが特定領域での性能を大幅に向上させることが可能になります。

このプログラムは、医療、法務、金融、工学などの専門性が高い分野における応用が期待されており、研究機関や大学、企業などの参加が推奨されています。

参加者はアルファ版のRFT APIへのアクセス権を得られるだけでなく、OpenAIのトレーニングインフラストラクチャを利用してモデルをトレーニングできます。

また、自社や研究チームが保有する独自データセットを活用し、特定のタスクに特化したAIモデルを開発することが可能です。

OpenAIは参加者からのフィードバックを受けてAPIの改善を図り、2025年初頭の一般公開を目指します。

実際の応用例として、法律分野ではトムソン・ロイターがRFTを使用し、法務アシスタントAIを開発しました。

このAIは、法務専門家が直面する高度な分析タスクを効率的に支援するために設計されています。

一方、医療分野では、バークレー研究所の研究者がRFTを用いて、希少遺伝病に関する研究を進めています。

この取り組みでは、患者の症状データをもとに原因となる遺伝子を特定するモデルが開発されました。

このモデルは、約1100件の症例データをもとに学習され、比較的小規模なデータセットでも高い精度を実現する成果を挙げています。

これらの事例は、RFTがどのようにして専門性の高い領域での課題解決を可能にするかを示す具体例です。

さらに、RFTは「ほとんどの専門家が同意する客観的に『正しい』答え」を必要とするタスクに特に効果的であり、専門性の高い分野において幅広く応用できる可能性があります。

今回のプログラムに参加することで、AI技術を活用した課題解決や業務効率化の可能性を広げることができます。

ただし、参加枠には限りがあるため、興味を持つ研究機関や企業は早めに応募することが推奨されます。

応募はOpenAIの公式サイト内にある応募フォームから可能です。


出典:Reinforcement Fine-Tuning Research Program | OpenAI
出典:OpenAI / X

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次