OpenAI、プロ向けフロンティアモデル「GPT-5.2」を発表

出典:Introducing GPT-5.2 | OpenAI

OpenAIは、プロフェッショナル向けの知識労働と長時間稼働するエージェントに特化した新しいフロンティアモデル「GPT-5.2」を発表しました。ChatGPT Enterpriseの平均ユーザーは既に1日40〜60分、ヘビーユーザーでは週10時間以上の時間削減効果を感じており、GPT-5.2はこうした生産性向上をさらに押し上げる位置づけです。

Already, the average ChatGPT Enterprise user says⁠ AI saves them 40–60 minutes a day, and heavy users say it saves them more than 10 hours a week.

ChatGPT Enterpriseの平均的なユーザーは既に、 AIによって1日40~60分の時間を節約できていると回答しており、ヘビーユーザーでは週10時間以上の時間を節約できていると回答しています。

出典:Introducing GPT-5.2 | OpenAI

GPT-5.2は、スプレッドシートやプレゼンテーションの自動作成、コードの生成とデバッグ、画像や長文コンテキストの理解、ツール呼び出しを伴う複雑な業務などで性能を大きく引き上げました。

出典:Introducing GPT-5.2 | OpenAI

44職種にわたる実務タスクを評価するGDPvalでは、GPT-5.2 Thinkingが産業界の専門家に対し70.9%の比較で「勝ちまたは同等」と判定され、人間エキスパート水準に達したとされています。

ソフトウェア開発分野では、実在のリポジトリを用いるSWE-Bench Proで55.6%と新たなベンチマークを記録し、プロダクションコードのバグ修正や大規模コードベースのリファクタリングなどを、より少ない手直しで実行できるようになりました。フロントエンド実装にも強く、単一のプロンプトから高度なWebアプリを生成できる点も特徴です。

出典:Introducing GPT-5.2 | OpenAI

また、長文コンテキスト処理ではOpenAI MRCRv2で広いトークン長にわたりGPT-5.1を上回り、約26万トークン規模の入力でも高い正答率を維持します。契約書やレポート、研究論文など長大なドキュメントを対象にした分析や要約、複数ファイルをまたぐワークフローに適しているとされています。画像理解でも、科学論文の図表を扱うCharXivやGUIスクリーンショット理解の評価でエラー率を大きく低減しました。

さらに、外部ツールを組み合わせたエージェント利用に関するτ2-bench Telecomでは98.7%の精度を記録し、顧客サポートなど長い対話の中で安定してツールを使いこなす能力が確認されています。ChatGPTの匿名化クエリを用いた評価では、誤りを含む回答の割合がGPT-5.1 Thinking比で約3割減少し、事実性の面でも改善が見られました。

出典:Introducing GPT-5.2 | OpenAI

GPT-5.2はChatGPTのPlus、Pro、Business、Enterpriseなどの有料プラン向けにInstant、Thinking、Proの3タイプが順次提供され、APIでは「gpt-5.2」「gpt-5.2-chat-latest」「gpt-5.2-pro」として利用可能です。API料金はgpt-5.2の場合、入力100万トークンあたり1.75ドル、出力100万トークンあたり14ドルで、キャッシュされた入力は90%割引となります。OpenAIは、トークン効率の向上により、同じ品質水準を達成する総コストは下がるケースも多いと説明しています。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次