OpenAIのResponses APIとは?使い方と料金を紹介!無料では利用できない

Responses APIは、エージェント構築に最適化されたAPIです。

ChatGPTでも使われている、OpenAIの高性能なモデルをAPIを通して利用できます。

また、Web検索、ファイル検索、コンピュータ操作といった組み込みツールを活用することで、高度なエージェント構築が可能となっています。

この記事では、Responses APIの概要や使い方、料金について解説します。

目次

Responses APIとは?

Responses APIは、OpenAIが新たに発表した、エージェント構築に最適化されたAPIです。

既存のAPIであるChat Completions API の使いやすさと Assistants API のツール利用機能を統合したものとなっています。

Responses APIでは、OpenAIが提供している組み込みツールを活用し、複雑なタスクを効率的に処理可能なエージェントを構築できます。

標準の組み込みツールとしては、Web検索、ファイル検索、コンピュータ操作をサポートしています。

以下で、それぞれの組み込みツールについてご紹介します。

Web検索

Web検索ツールによって、開発者はAPIを使ってWeb上の適切な引用元とともに素早く最新の情報を取得できます。

このツールはgpt-4oとgpt-4o-miniモデルで利用でき、ほかの組み込みツールと組み合わせて使うことが可能です。

Web検索ツールを活用することで、ショッピングアシスタントや旅行予約エージェントなど、Web上の最新情報を必要とするユースケースでのアプリ開発ができます。

Responses APIのWeb検索ツールでは、ChatGPTの検索機能と同じモデルが使用されています。

ツールは非常に高性能であり、事実的な質問への回答精度を評価するSimpleQAというベンチマークにおいて、GPT‑4o search previewは90%、GPT‑4o mini search previewは88%のスコアを達成しています。

出典:New tools for building agents | OpenAI

ファイル検索

ファイル検索ツールを使うことで、大量の文書から関連情報を簡単に抽出できます。

複数のファイル形式に対応しており、クエリ最適化やメタデータの絞り込み、カスタム再ランキングといった機能によって高速かつ正確な検索が可能です。

これらの機能を活用することで、追加のチューニングや設定不要でRAGパイプラインを構築できます。

コンピュータ操作

コンピュータ操作ツールを利用することで、コンピュータ上で複雑なタスクを実行できるエージェントを構築できます。

このツールは、OpenAIのOperatorで使われているモデルと同じモデルによって動作します。

使われているモデルは、コンピュータ操作タスクの性能についてのベンチマークやブラウザの操作に関するベンチマークにおいて、次のようなスコアを達成しています。

出典:New tools for building agents | OpenAI

コンピュータ操作ツールは、マウスやキーボードの操作をキャプチャして実行可能なコマンドに変換し、コンピュータ上のタスクを自動化します。

これにより、エージェントがWebブラウザを通じてフォームの入力やオンライン注文、レガシーシステムでのデータ入力などのタスクを自動化することが可能です。

Responses APIの特徴

ここでは、Responses APIの特徴について解説していきます。 

やり取りの維持

通常のAPIでは、リクエストのたびに新しい会話が始まるため、もしコンテキストを維持したい場合には会話の履歴をコピーして送る必要があります。

しかし、Responses APIでは会話の状態をサーバー側で管理できるため、ユーザーは以前のやり取りを維持したままスムーズに会話を続けることができます。

そのため、従来のAPIのように膨大な履歴を送信することなく、文脈を考慮した回答を得ることができます。

複数のツールを統合

従来のシステムでは、Web検索やファイル検索、コンピュータ操作などのツールを利用する際は、それぞれ個別のAPIを呼び出す必要がありました。

しかし、​Responses APIはこれらのツールを統合して提供しているため、一回のAPIコールで複数のツールを利用でき、より高度なエージェントの構築が可能です。

これにより、ユーザーのニーズに合わせたより柔軟なソリューションの提供ができるようになります。

マルチステップワークフローの管理

Responses APIには、複数の手順を組み合わせたワークフローを管理する機能も備わっています。

単なる質問に対する回答にとどまらないワークフローを構築できます。

Responses APIを活用することで、一連のタスクを自動化し、さらに高度なエージェントを構築することが可能です。

Responses APIの使い方

ここでは、Responses APIの使い方をステップごとに解説していきます。

Responses APIを使い始める際は、以下の手順で進められます。

なお、今回はPythonでの使い方を説明します。

STEP
OpenAIアカウントの作成

OpenAI APIを初めて利用する場合、OpenAIアカウントを作成する必要があります。

OpenAI Platformにアクセスし、アカウントを作成しましょう。

STEP
APIキーの取得

OpenAIアカウントが作成できたら、OpenAI PlatformでAPIキーを取得します。

APIキーは、組織設定から取得できます。

APIキーの名前やプロジェクト、権限を設定してキーを作成します。

APIキーを作成したら、コピーして安全な場所に保管しておきましょう。

「Done」をクリックするとAPIキーを表示できなくなります。

なお、作成したAPIキーは公開しないように注意してください。

STEP
支払い情報の登録

APIキーを作成できたら、支払い情報を登録します。

なお、ChatGPTの支払いとは別物なので、有償版のChatGPTを契約している人でも登録が必要です。

設定から「Billing」タブに移動し、「Add payment details」をクリックします。

利用できる支払い方法はクレジットカードのみです。

必要な情報を入力して登録しましょう。

登録後はAPI用のクレジットを購入することでAPIを利用可能となります。

STEP
OpenAIライブラリのインストール

PythonでResponses APIを利用するための準備として、使用する環境にOpenAIライブラリをインストールします。

pip install openai
STEP
APIキーの設定

取得したAPIキーは、コード内で直接使用するか、環境変数として設定します。

コード内で使用する場合は、OpenAI()クラスの引数を使って以下のように設定します。

from openai import OpenAI
client = OpenAI(api_key="your-api-key-here")

ただし、APIキーをコード内に書くのはセキュリティ上のリスクがあります。

特にほかの人とコードを共有する場合は環境変数を使う方法をおすすめします。

環境変数として設定する場合は、OPENAI_API_KEYを指定します。

export OPENAI_API_KEY="your_api_key_here" #macOSまたはLinux
setx OPENAI_API_KEY "your_api_key_here"   #Windous
STEP
APIの呼び出し

以下はAPIキーを環境変数で設定した場合のAPIを呼び出す際のコード例となっています。

from openai import OpenAI
client = OpenAI()

response = client.responses.create(
    model="gpt-4o",
    input="SF小説の冒頭文を生成してください。"
)

print(response.output_text)

この例では、ChatGPTと同じようにinputに対する出力を生成します。

Responses APIの料金は?無料では利用できない

Responses APIは、使用する際に別途料金が発生するわけではなく、使用するトークンとモデルに基づいて課金されます。

ただし、組み込みツールを使用する場合には追加で課金が必要です。

以下に料金表を示します。

モデモデルル入力料金出力料金
gpt-4o$2.50$10.00
gpt-4o-mini$0.15$0.60
モデル料金(100万トークンあたり)
モデルコンテキストサイズ料金
gpt-4o/gpt-4o-search-preview$30.00
$35.00
$50.00
gpt-4o-mini/gpt-4o-mini-search-preview$25.00
$27.50
$30.00
Web検索ツール料金(1000回の呼び出しあたり)
サービス料金
ファイルストレージ$0.10(1GB/日あたり)
ツール呼び出し$2.50(1000回あたり)
ファイル検索ツール料金
モデル入力料金出力料金
computer-use-preview$3.00$12.00
コンピュータ操作料金(100万トークンあたり)

なお、ファイルストレージは最初の1GBは無料となっています。

Responses APIと既存APIの違い

OpenAIは、Responses APIのほかにもChat Completions API⁠とAssistants APIを提供しています。

ここでは、それぞれのAPIとResponses APIとの違いを説明します。

Chat Completions API⁠との違い

Chat Completions API⁠は、現在最も広く利用されているAPIです。

Responses APIと違い、標準組み込みツールはサポートしていませんが、今後も組み込みツールや複数回のモデル呼び出しを必要としない新しいモデルや機能は提供されるため、引き続き使うことができます。

しかし、Responses APIはChat Completions APIの機能をすべて含んでおり、パフォーマンスも同等なため、新たにAPIを使い始める場合はResponses APIがおすすめです。

Assistants APIとの違い

Responses APIは、Assistants APIのベータ版に対するフィードバックをもとに改善を実施したAPIです。

 Assistants APIには、Assistantオブジェクト、Threadオブジェクト、Code Interpreterツールといった機能がありますが、これらの機能はResponses APIでも使えるようにするために開発が進められています。

そして、この作業が完了次第、2026年半ばを目処としてAssistants APIの正式な廃止が予定されています。

現在ではAssistants APIでのみ使える機能もありますが、いずれResponses APIがAssistants APIにとって代わるようになるでしょう。

まとめ

Responses APIは、OpenAIが新たに発表したAPIです。

標準の組み込みツールを備えており、複雑なタスクを効率的に実行できるエージェント構築ができます。

料金はモデル別の標準レートが適用されますが、組み込みツールを使用する場合は別途コストがかかります。

無料では利用できませんが、複雑なタスクを解く高度なエージェントを構築する場合に最適なAPIであると言えるでしょう。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次