ElevenLabsのAgent Workflowsとは?使い方と料金!ワークフローで会話が作れる

ElevenLabsのAgent Workflowsとは、高品質な音声AIで会話型エージェントの応答フローを設計・作成できる革新的な機能です。

この記事では、具体的なAgent Workflowsの使い方を、応答を自動生成する実践例を含めて解説します。

さらに、導入前に把握すべき料金体系やコストの注意点まで網羅します。

\ 無料プランでお試し /

目次

ElevenLabsのAgent Workflowsとは?会話AIを設計する新機能

ElevenLabsの「Agent Workflows」は、単なる音声生成AIの枠を超え、複雑な会話の流れ(フロー)そのものを視覚的に設計・作成できる革新的な機能です。

従来のチャットボット開発では、コード記述や複雑なルール設定が必須でした。しかしElevenLabsのAgent Workflowsは、まるでフローチャートを描くように、会話のステップ(ノード)を配置し、それらを線(エッジ)で結ぶだけで、自律的に動作するAIエージェントを構築できます。

これにより、コールセンターの一次対応、予約受付、FAQ対応といった業務を自動化する高度な音声エージェントの内製化が、エンジニア以外のPMやCS責任者でも主導しやすくなります。

ElevenLabs自体については以下の解説記事をご覧ください。

あわせて読みたい
ElevenLabsとは?使い方と料金や日本語対応について!商用利用や再翻訳も紹介 ElevenLabs(イレブンラボ)は、AIを活用した最先端の音声合成プラットフォームです。 日本語を含む多言語対応も可能、自然な抑揚のある音声を生成できることが特徴で、テキストの読み上げから音声変換、再翻訳まで幅広い使い方ができ、商用利用にも対応しています。 本記事では、ElevenLabsの基本的な使い方から料金プランまで詳しく解説します。

\ 無料プランでお試し /

ElevenLabsのAgent Workflowsで実現できることと3つの特徴

Agent Workflowsはあらかじめ定義された会話フローに基づき、ユーザーの発話を理解し適切な応答を生成します。

最大の特徴は、ノーコード/ローコードでの会話設計が可能である点です。ドラッグ&ドロップ対応のビジュアルエディタで、会話の流れを直感的に作成でき、「もしユーザーがAと言ったらBに進む」といった分岐処理をコーディングなしで実装可能です。

次に、柔軟な外部ツール連携も強みです。会話の途中で外部API(自社の在庫DB、CRM、決済システムなど)を呼び出し、その結果を会話に反映させられます。単なる応答AIではなく、実務を処理できるエージェントを構築できます。

さらに、シームレスな人間への転送にも対応しています。AIでの対応が困難な場合や、ユーザーが希望した場合に即座に人間のオペレーターへ通話を転送でき、自動化と有人対応のスムーズな連携を実現します。

\ 無料プランでお試し /

ワークフローを構成する「ノード」の種類と役割を解説

Agent Workflowsにおける「ノード」とは、会話フローを構成する「個々のタスク」や「処理の分岐点」を指します。これらのノードを組み合わせることで、エージェントの振る舞いを設計します。

主要なノードにはいくつかの種類があります。以下にそれぞれの説明をします。

  • サブエージェント:本人確認や予約内容のヒアリングなど特定のタスクに特化した小規模なAIエージェント。メインのエージェントから呼び出され、役割分担が明確に。
  • エージェントの転送:別の専門的な役割を持つAIエージェントに転送。
  • 電話番号の転送:指定された外部の電話番号(例:既存のコールセンターの番号)に通話を転送。
  • 道具:外部のAPIやデータベースを呼び出し、在庫確認や決済処理など外部リソースとの連携に使用。
  • 終わり:会話フローの終着点を示し、このノードに到達すると会話が終了。

会話の流れを制御する「エッジ(遷移タイプ)」

「エッジ」とは、ノード間を結ぶ「矢印(線)」のことで、会話が次に進むルートを示します。Agent Workflowsの強力な点は、このエッジに「遷移タイプ」を設定できることです。

例えば、何かを販売するサイトのカスタマーサポートに問い合わせがあったと仮定すると、以下のような構成が考えられます。

「ディスパッチツール(在庫照会システム)」ノードから、「成功(在庫あり)」と「失敗(在庫なし)」という2本のエッジを作成。AIはツールの実行結果を判断し、自動的に適切なルート(「在庫あり」なら決済ノードへ、「在庫なし」なら謝罪ノードへ)を選択します。

また、遷移タイプに関して「次のノードに進める場合(フォワード)」と「前の処理を繰り返す場合(バックワード)」の二つの条件を設定することができます。

遷移タイプは様々な形式で作成可能で、以下の3つに整理することができます。

  • LLM Condition (LLM条件):AI (LLM) の判断で分岐させる最も柔軟な条件です。「ユーザーが『はい』と言ったか?」といった自然な文章で設定。
  • Expression (数式):「retries < 3」のように関数や数式で分岐。
  • None(無条件遷移):条件なしで会話を次のノードに自動的に移行。

\ 無料プランでお試し /

ElevenLabsのAgent Workflowsの使い方|セットアップから基本操作まで

Agent Workflowsのセットアップは、いくつかのステップに分かれています。

ここでは、AIエージェントの作成からエディタの基本操作まで、導入に必要な手順を解説します。

STEP
アカウントを作成する

ElevenLabsの公式サイトからサインアップを選択します。

Googleアカウントもしくは、メールアドレスとパスワードでサインアップすることができます。

サインアップ後、業種・業界に関するアンケートの他に下記の選択画面が表示されますが、今回は「AIエージェントを作成すること」が目的なので右側の「エージェントプラットフォーム」を選択します

STEP
エージェントの作成

セットアップが完了したら、ElevenLabsのダッシュボードから「エージェント」を選択しエージェントを新規作成します。

この時、エージェントの初期テンプレートとして「パーソナル」「ビジネス」「ブランク」の3種類から選択を求められます。

「パーソナル」「ビジネス」は、特定のユースケース向けにあらかじめ最適化された設定やプロンプトが用意されています。Workflowsを使って独自の会話フローをゼロから自由に設計する場合は、「ブランク」を選択するのが基本です。

Workflowsを前提とする場合、「ブランク」以外を選ぶと意図しないテンプレートの挙動がワークフローの制御と競合する可能性があるため、「ブランク」での作成を推奨します。

STEP
エージェントの基本設定(音声・知識ベース)

エージェントを作成したら、次に基本設定を行います。まず、エージェントの「声」となる音声を選択します。ElevenLabsの高品質な音声生成ライブラリから選ぶか、独自のボイスをクローンすることも可能です。

次に、エージェントの知識源となる「ナレッジベース」を設定します。ここには、FAQドキュメントや製品マニュアルなどをアップロードでき、AIはこれらの情報を基にカスタマイズされた応答を生成します。

音声の選択はエージェントの印象を大きく左右するため、ペルソナに合わせて慎重に選びましょう。ナレッジベースに登録する情報は、ノイズが少なく整理されているほど応答AIの精度が向上します。

STEP
Workflowsエディタの基本操作(ノード配置・接続)

初期準備が完了したら、「ワークフロー」タブを開きビジュアルエディタを起動します。「+アイコン」から必要なノード(例:Subagent, Tool)を選択し、キャンバス上に配置します。次に、ノード同士をドラッグして「エッジ(線)」で接続し、会話の流れを作成していきます。

エッジを接続する際、それが「Forward」(次へ進む)なのか、「Backward」(前に戻る)のリトライ処理なのかを選択します。

この段階では、まず大まかな会話の幹(ハッピールート)を作成し、その後に分岐(エラー処理など)を追加すると効率的です。ノードには分かりやすいラベルを付け、フローの可読性を高めることが重要です。

STEP
サブエージェントの設計(役割分担と応答方針の分離)

複雑なタスクは「Subagent(サブエージェント)」として切り出し、役割を分離します。例えば、「本人確認」や「予約処理」といった特定のタスクを担当するAIエージェントを別途作成します。メインのワークフローは、これらサブエージェントを適切なタイミングで呼び出す「司令塔」の役割を担います。

サブエージェントは、それぞれが独立した文脈(メモリ)と応答方針を持つことができます。役割を細かく分離しすぎると管理が煩雑になるため、業務プロセス上の「意味のあるまとまり」で分離するのがコツです。

\ 無料プランでお試し /

【実践】Agent Workflowsで会話フローを作るステップ例

基本的な操作を理解したら、次は実践的な会話フローを作成します。

ここでは、AIエージェントがユーザーの意図やツールの実行結果に応じて、動的に会話を分岐させる「遷移タイプ」の設計が鍵となります。

実際に「小規模なクリニックの予約受付を自動化する」AIエージェントを作成していきます。

以下の要件に基づき、フローを構築します。

AIエージェントの要件
  • 患者の本人確認(氏名・ID)を行う。
  • 外部の予約システムAPI(Dispatch Tool)を呼び出し、希望日時の空きを確認する。
  • 空きがあれば予約を生成(APIを再度呼び出し)し、完了を音声で伝える。
  • 空きがない場合、またはAIでの対応が困難な場合は、人間の受付に音声通話を転送する。

予約受付フローを設計(予約確認→予約照会→決済→有人転送)

まず「①本人確認」タスクを行うSubagentを配置します。

次に「②予約照会」を行うDispatch Toolノードを配置します。ここで、ノード間のエッジ(線)に「遷移タイプ」を設定します。本人確認が成功した場合のみ、「予約照会」ノードへ「フォワード(Forward)」で進むようにします。

さらに、LLMが会話の途中でユーザーの「オペレーターと話したい」という意図を検知した場合、どのステップからでも「⑤有人転送」ノードへ遷移する横断的な分岐も設計します。

遷移タイプは、ツールの結果条件(成功/失敗)だけでなく、LLMによる意図解釈(例:ユーザーがキャンセルを希望した)にも基づいて設定する必要があります。この網羅性が、会話体験を壊さないAIエージェントの鍵です。

チェックリスト
  1. 作成したダイアグラムに「本人確認」「在庫照会」「予約実行」「人間転送」の各ステップが含まれているか?
  2. 「在庫照会」の成功/失敗による分岐が明記されているか?

予約照会の実装(外部ツールと連携)

Dispatch Toolを実行させるには、事前にどのAPIを呼び出すかをElevenLabsのToolsセクションで先に登録しておく必要があります。

API連携方式は、Server tools(Webhook)とClientの2種類があります。Elevenlabsから直接アクセスできる公開APIであればWebhookを、社内ネットワーク上など独自処理が必要な場合はClientを選択しましょう。

出典:Elevenlabs公式

本人確認後に予約照会のDispatch Toolを配置することで、必ず外部API(クリニックの予約システム)が呼び出されるようになります。

Dispatch Toolには標準で「成功(success path)」と「失敗(failure path)」の出力が用意されています。これが「結果条件」の基点です。

「成功」はAPI呼び出しが成功した場合で、次のタスクへ遷移します。「失敗」はAPIがタイムアウトした場合などで、エラーハンドリング用のサブエージェントへ遷移します。

APIの失敗は必ず発生するものとして、「失敗パス」を設計することが不可欠です。

リトライ設計を行う際は、「失敗」から出たエッジを、「後方(Backward)」遷移として再度同じDispatch Toolノードの入力側に戻すことで実現できます。無限ループを避けるために、リトライ回数をカウントするカスタム変数や、LLMに「再試行しますか?」とユーザーに確認させるステップを挟むことが推奨されます。

チェックリスト
  • APIの連携方式(Webhook / Client)を正しく選択・設定しているか?
  • Dispatch Tool ノードの on_success パスは、次のステップに接続されているか?
  • on_failure パスは、エラーハンドリング用のノード(またはリトライ)に接続されているか?
  • リトライを実装した場合、無限ループを回避する条件(Expressionなど)が設定されているか?

テストと品質維持(テストシナリオ作成とログ検証)

作成したワークフローは、必ずテストを行いましょう。ElevenLabsのテストコンソールを使い、シミュレーション音声やテキストで会話を実行します。遷移タイプを網羅的にテストしましょう。

「予約が成功するケース」「予約が失敗する(空きなし)ケース」「APIがタイムアウトするケース」「ユーザーが途中でオペレーターを要求するケース」など、複数のテストシナリオを作成して実行します。

実行後は必ず「ログ」を検証し、AIエージェントが意図した通りの分岐(エッジ)を辿っているかを確認しましょう。ログには、LLMやDispatch Toolがどのような結果を返したかが記録されています。意図しない遷移が発生した場合、このログが重要な手がかりとなります。

チェックリスト
  • ハッピーパス(予約成功)のシナリオは意図通り動作したか?
  • 失敗パス(在庫なし、APIエラー)は意図通り分岐したか?
  • 人間への転送パスは意図通り動作したか?
  • ログを見て、AIの動作(通過ノードや判断理由)が追跡可能であったか?

\ 無料プランでお試し /

ElevenLabsのAgent Workflowsの料金体系を徹底解説

Agent Workflowsの導入で最も重要なのがコスト計算です。

料金は固定の月額ではなく、AIエージェントが動作した時間(分課金)と、使用するAIモデル(LLM)の費用に基づきます。

ここでは、クレジット換算の仕組みやコスト最適化の注意点を解説します。

料金プラン別のクレジット一覧

ElevenLabsの料金は、サブスクリプションプラン(Free/Starter/Creator/Pro/Scale/Business)ごとに付与される「クレジット」を消費する形で支払います。ElevenLabsのAgent Workflowsでは、AIエージェントがユーザーと会話した時間(分単位)が、このクレジットから引かれます。

それぞれのプランの詳細については以下の表を参考にしてください。

スクロールできます
項目FreeStarterCreatorProScaleBusiness
月額料金$0$5$22$99$330$1,320
割り当てられる分数15分50分250分1,100分3,600分13,750分
同時リクエスト数
(Flash/Turboモデル)
4610203030
テキストメッセージのコスト$0.004$0.004$0.003$0.003$0.003$0.003

上記の料金の詳細を参考にコストを試算してみます。

たとえば、1回の予約対応(本人確認〜予約完了)にかかる平均時間が5分かかるサロンが、Creatorプラン(月250分の音声枠)を契約すると、250分÷5分=月間50件となり、月額22ドルで50件の予約対応ができます。

\ 無料プランでお試し /

コストに影響する「静寂時割引」と「LLM費用パススルー」の注意点

料金を計算する上で、2つ注意点があります。

ひとつは「静寂時割引(Silence Discount)」です。これは、AIエージェントがユーザーの応答を待っている間(沈黙している時間)の分課金が割引される仕組みです。10秒を超える無音時間には95%の割引が適用されます。

Multimodal calls are charged based on the call duration, with a 95% discount for periods of silence longer than 10 seconds. 

訳)

マルチモーダル通話は通話時間に基づいて課金され、10秒を超える無音期間には95%の割引が適用されます。

出典:How much does ElevenLabs Agents (formerly Conversational AI) cost?

もうひとつの注意点は「LLM費用パススルー」です。Agent Workflowsで使用するAI(GPT-4oやClaude 3など)の利用料は、ElevenLabsのクレジット(分課金)とは別に、実費(パススルー)で請求されます。このLLM費用は、トークン単位(文字数に近い概念)で計算されます。

なお利用できるAIは、ElevenLabs、Google、OpenAI、Anthropicです。

つまり、最終的なコストは「AIエージェントの会話時間(分)」と「AIの思考量(トークン)」の合計になるため、注意が必要です。

同時実行数とスケール設計の考え方(ピーク対策と待ち行列)

AIエージェントの運用では「同時実行数(Concurrency)」がコストと品質のボトルネックとなります。これは、AIエージェントが同時に何人のユーザーと会話できるかの上限値です。

プランごとにこの同時実行数の上限が定められています。自社のコールセンターのピークタイム(例:月曜の午前中)に必要な同時接続数を試算し、それをカバーできるプランの選択が必要です。上限を超えたリクエストは「待ち行列(Queue)」に入るため、顧客体験の悪化に直結してしまいます。

\ 無料プランでお試し /

導入後に役立つ運用の勘所|品質・コスト・安全性を高める

AIエージェントを作成して公開した後が運用の本番です。継続的にパフォーマンスを監視し、改善を続けることで会話をするAIの品質とコスト対効果を最大化できます。

ここでは、事業責任者やPMが押さえるべき運用の勘所を解説します。

重要なKPIの設計(一次解決率・人間引き継ぎ率・平均通話時間)

AIエージェントのパフォーマンスは、必ず数値で可視化します。

特に重要なKPIとして、「一次解決率(AIだけで問題が解決した割合)」、「人間引き継ぎ率(オペレーターへの転送が発生した割合)」、そして「平均通話時間」の3つを設計します。

一次解決率が高く、人間引き継ぎ率が低いほど自動化は成功しています。平均通話時間は、AIの応答生成が冗長でないか、またはユーザーが迷っていないかを示す指標となります。これらのKPIをダッシュボードで定点観測することが運用の第一歩です。

コストを最適化する実践テクニック

AIエージェントの運用コストは、主に「会話時間(分課金)」と「LLM利用料(トークン課金)」で決まります。コスト最適化の最も有効なテクニックは、「処理の分離」です。

例えば、本人確認のような単純なタスクは、安価で高速なAIモデル(LLM)を使うサブエージェントに担当させます。そして、複雑な問い合わせ対応など、高度な思考が求められる区間だけ高性能だが高価なAIモデル(GPT-4oなど)を使うサブエージェントに切り替えます。

このように、ワークフロー内でAIの性能を使い分けることで、AIエージェント全体の品質を維持しつつ、コストを大幅に削減できます。

失敗時のハンドリング設計(エラー経路とユーザー再案内)

会話体験の品質は、「失敗時の対応」で決まります。AIエージェントが外部ツールの呼び出しに失敗した場合(例:APIタイムアウト)や、ユーザーの音声を正しく認識できなかった場合に、AIが沈黙したり停止したりするのが最悪の体験です。

これを防ぐため、Workflowsの設計段階で「失敗時のハンドリング」を徹底します。Dispatch Toolの「on_failure」経路を必ず作成し、「申し訳ありません、もう一度試します」といったユーザーへの再案内や、最終的に人間へ転送するセーフティネットを必ず設けることが、安全な運用に不可欠です。

\ 無料プランでお試し /

まとめ

ElevenLabsのAgent Workflowsとは、単なる音声生成AIではなくAIエージェントとの複雑な会話フローそのものを視覚的に設計・作成できる強力なプラットフォームです。

これまで外部ベンダーに依頼するか、高度なエンジニアリングが必要だった「音声自動対応」の内製化を、PMやマーケターが主導できるレベルまで引き下げました。

使い方は、ノードとエッジを使った視覚的なもので、API連携(Dispatch Tool)や失敗時の分岐(on_failure)さえ押さえれば、実用的なAIエージェントを構築できます。

そして料金は、従来の文字数課金ではなく「分課金」がベースとなり、LLM費用が別途発生する点に注意が必要ですが、静寂時割引や安価なAIモデルとの使い分けでコスト最適化が可能です。

カスタマーサポートの一次対応や予約受付の自動化を検討している方は、まずFreeプランでワークフローを作成してみてはいかがでしょうか。

\ 無料プランでお試し /

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次