
OpenAIは、新機能「ChatGPTエージェント」を発表しました。この新たなエージェント機能は、ブラウザ、ターミナル、APIなどを自律的に操作し、複雑なタスクを計画・実行することが可能です。
従来のChatGPTは、ユーザーの質問に対して応答を返す対話型のツールでしたが、今回のエージェント機能では、推論から具体的なアクションへの移行をシームレスに行えるようになりました。例えば、金融情報の詳細な調査やオンラインフォームへの入力、プレゼンテーション資料作成まで、自律的に一貫して処理できるようになります。30分を超えるような長時間を要するタスクも、自動で最後まで遂行できます。
「ChatGPTエージェント」は、OpenAIがこれまで提供してきたウェブサイトとの対話型ツール「Operator」と、複雑なウェブ情報の収集・分析に特化した「deep research」の二つの技術を統合して生まれました。両者の得意分野を組み合わせることで、より高度な自動処理を実現しています。

エージェントは、ユーザーの指示に応じて自ら判断し最適な手法を選び取ります。タスクの進行中でもユーザーが常にコントロール可能で、重要な操作を実行する際は事前に許可を求める仕組みも備えました。また、リスクの高い金融取引や機密情報を扱う作業は、安全性の観点から積極的に拒否します。
今回の発表に先立ち、OpenAIは実際の業務を想定したベンチマークテストを複数実施しました。データ分析の評価テスト「DSBench」ではChatGPTエージェントが人間や既存のAIモデルを大幅に超える成果を示しました。

また、スプレッドシート操作能力を測定する「SpreadsheetBench」でも、従来のAIモデルを大きく上回る性能を発揮し、人間に迫る高いスコアを記録しています。

本機能はPro、Plus、Teamプラン向けに本日から順次提供が開始されており、EnterpriseおよびEducationプラン向けには7月からの提供を予定しています。