ElevenLabsの「Conversational AI」とは?使い方と料金!会話型AIエージェントが無料?

高品質な音声合成で注目を集めるElevenLabsが、2024年11月に会話型AI機能「Conversational AI」をリリースしました。

Conversational AIは、会話型音声AIエージェント開発のプラットフォームとして、簡単に音声AIエージェントを構築できるのが特徴です。

本記事では、その概要から使い方、料金プラン、無料で使える機能までをわかりやすく解説。

あわせて、どんなシーンで活用可能か、活用例も紹介します。

目次

ElevenLabs Conversational AIとは?会話型音声エージェント開発プラットフォーム

ElevenLabs Conversational AI

ElevenLabs Conversational AIは、音声認識(Speech to Text)・自然言語処理(NLP)・音声合成(Text to Speech)などのAI技術を組み合わせることで、人間と自然な対話が可能な音声AIエージェントを迅速かつ容易に構築できるプラットフォームです。

ElevenLabs は、2022年創立のスタートアップで、AIを活用した高度な音声合成プラットフォームを提供しています。

テキストを自然でリアルな音声に変換する技術に強みを持っており、感情やイントネーションを忠実に再現できる点が特徴です。

ElevenLabsは、 TTS(Text to Speech)などの音声合成機能だけではなく、音声で会話するAIエージェントを構築するためのプラットフォームとして、2024年11月に「Conversational AI」を発表しました。

ElevenLabs Conversational AIでは、ウェブサイト・モバイルアプリ・電話など、さまざまなプラットフォームに、テキストではなく音声を使った対話型インターフェースを組み込むことが可能です。

ElevenLabsについては以下の記事で解説しています。

あわせて読みたい
ElevenLabsとは?使い方と料金や日本語対応について!商用利用や再翻訳も紹介 ElevenLabs(イレブンラボ)は、AIを活用した最先端の音声合成プラットフォームです。 日本語を含む多言語対応も可能、自然な抑揚のある音声を生成できることが特徴で、テキストの読み上げから音声変換、再翻訳まで幅広い使い方が可能で、商用利用にも対応しています。 本記事では、ElevenLabsの基本的な使い方から料金プラン、活用方法まで詳しく解説します。

ElevenLabs Conversational AIの特徴

ここでは、会話型音声エージェント開発プラットフォームであるElevenLabs Conversational AIのおもな特徴を説明していきます。

  • AI技術が一つのプラットフォーム内で完結
  • 音声エージェントのカスタマイズの容易性
  • さまざまな音声モデルと言語を利用可能

それぞれの特徴を見ていきましょう。

AI技術が一つのプラットフォーム内で完結

会話型音声エージェントを開発するには、音声認識API・チャットボットAI・音声合成APIなどのAI技術をエージェントに統合する必要がありました。

ElevenLabs Conversational AIはそれらを一つのプラットフォーム内で完結でき、開発の手間を大幅に削減可能です。

音声エージェントのカスタマイズの容易性

ElevenLabs Conversational AIでは、LLMとして、Gemini・ChatGPTなどのメジャーなモデルを組み込むことはもちろん、独自に構築したLLMを組み込むことも簡単にできます。

また、外部関数呼び出しにより、他アプリと連携して、リアルタイムでの情報を取得したり、アクションを実行したりすることが可能です。

さまざまな音声モデルと言語を利用可能

エージェントの目的や利用場面に応じて、声色やアクセントなどを考慮して、ElevenLabsの何千もの音声ライブラリからエージェントの声を選択できます。

さらには、自分の声を録音して作るクローンボイスやテキストから生成するオリジナル音声も利用可能です。
また、31か国語で会話できます。

\ 無料プランでお試し /

ElevenLabs Conversational AIの使い方・導入方法

Conversational AIを使うには、まずElevenLabsのサイトで無料アカウントを作成し(Googleアカウントやメールで登録可能)、Conversational AI専用のダッシュボードにアクセスします。

以下に、エージェント作成から対話開始までの基本的な流れをステップごとに解説します。

アカウント作成

ElevenLabsのConversational AIを利用するには、まず公式サイトでアカウントを作成する必要があります。

以下の手順で簡単にアカウントを取得できます。

ElevenLabs Account

プロジェクトの立ち上げ

ElevenLabsのConversational AIで会話型音声AIエージェントを開発するには、あらたにエージェントを作成する必要があります。

以下の手順で簡単にエージェントを作成できます。

STEP
Agent管理画面を開く

ElevenLabsのMy Workspaceで「AI agent」アイコンをクリックして、Agent管理画面を開きます。

STEP
新規Agentを作成する

Agent管理画面で「Start form blank」ボタンをクリックして、新規Agentを作成します。

音声AIエージェント作成と会話テストの手順

ここでは、音声AIエージェントを作成する手順を紹介します。

会話テストも実施可能なので、その方法もあわせて解説します。

STEP
基本設定

「Agent」タブで基本的な挙動を設定します。
ここでは以下の項目を入力できます。

ElevenLabs Conversational AI
  • Agent Language(エージェント言語): エージェントがやり取りに使う言語を選択します。
    日本語を選べば音声認識と音声合成が日本語モードになり、やり取りがスムーズです。
  • First message(最初のメッセージ): 会話開始時にAI側から話しかける内容を設定します。
    空欄にするとユーザーからの発話を待機します。
  • System prompt(システムプロンプト): エージェントの人格や役割、口調などを指示するテキストを指定します。
  • LLM(言語モデル選択): 会話の頭脳となるLLMを選びます。
    GeminiやGPT-4等が利用できます。
    回答の創造性を調整する温度(temperature)や一度に扱うトークン数の上限も設定可能です。

入力・選択が完了したら、「Save」ボタンで保存します。

STEP
音声設定

「Voice」タブで、エージェントが話す声を選択します。

ElevenLabsではあらかじめ用意されたプロの音声モデルや、他ユーザーが公開したユニークな声が多数利用できます​。

さらには、アップロードした肉声から生成したクローンボイスや、Voice Design機能で得たオリジナル音声モデルも使用可能です​。

高品質な音声・モデル・LLM を使用すると、応答時間が長くなる可能性があります。
アシスタントの利用場面に応じて、品質とレイテンシのバランスをとることが重要です。

STEP
高度設定やウィジェット埋め込み

必要に応じてAdvancedタブ・Knowledge Baseタブ・Widgetタブで高度な設定を行うことができます。

Advancedタブ応答遅延・応答時間制限の制御、認証設定など
Knowledge Baseタブ外部知識データの登録
Widgetタブサイト埋め込みに関する設定

たとえば、Authentication(認証)を有効にすることで、第三者に無断で使われることを防げます​。

Knowledge Baseに自社の製品マニュアルPDFをアップロードすることで、エージェントに利用させることもできます。

STEP
対話のテストと開始

「Test AI agent」ボタンを押すとブラウザ上でマイクとスピーカーを使ったテスト会話が可能です。

ユーザーの発話をAIが文字起こしし、応答音声をリアルタイムに再生してくれます。

これにより、音声AIエージェントの基本的な動作を確認可能です。

音声AIエージェントの組み込み

ElevenLabs Conversational AIで作成したエージェントは、他者との共有や、自社サイトへの埋め込みも可能です。

ダッシュボード上部にある共有ボタン(紙飛行機アイコン)をクリックすると、そのエージェント専用の公開リンクが取得可能となります​。

このリンクを共有すれば、相手はブラウザ上の専用ページであなたのエージェントと対話できます。

Widgetタブには埋め込み用のコードスニペットが用意されており、自社サイトのHTMLに貼り付ければ対話ウィジェットを表示可能です​。

開発者向けにはReact・Python・JavaScript・Swift用のSDKや、WebSocketによるリアルタイムAPIも用意されており、独自アプリやシステムへの組み込みも柔軟に行えます​。

\ 無料プランでお試し /

ElevenLabs Conversational AIの料金プランと無料で使える範囲

ElevenLabs Conversational AI

ElevenLabs Conversational AIの料金体系はどうなっているのでしょうか。

少し試してみたいときなどに無料で試してみることはできるのでしょうか。

ここでは、ElevenLabs Conversational AIの料金プランと無料で利用できる範囲がどんなものかを説明します。

まず、ElevenLabs Conversational AIの料金プランの説明からはじめましょう。

ElevenLabs Conversational AIの料金プラン

項目月額料金月額料金(円)※1会話時間クレジット1分あたりの
追加料金
Free0ドル0円15分1万追加不可
Starter5ドル約750円50分3万追加不可
Creator22ドル 約3,300円250分10万~0.12ドル/分
Pro99ドル約14,850円1,100分50万~0.11ドル/分
Scale330ドル約49,500円3,600分200万~0.10ドル/分
Business1,320ドル約198,000円13,750分1,100万~0.08ドル/分
出典:https://elevenlabs.io/docs/conversational-ai/overview
※1:1ドル150円で算出

ElevenLabs Conversational AIの料金プランは上記のように6つのプランから構成されており、無料でも利用できます。

各プランのポイントは以下のとおりです。

プランポイント
Freeプラン月10,000クレジットが付与され、約15分間の会話利用が可能
Conversational AIも利用可能だが、商用利用は不可
クレジットの次月繰り越しは不可
Starterプラン月額5ドルの個人向けプランで、月30,000クレジットで約50分の会話が可能
商用ライセンスが含まれ、構築した音声AIエージェントは営利目的の利用可能
クレジットの従量課金は不可(上限を超えるとその月は利用停止)
Creatorプラン月額22ドルのプランで、月100,000クレジットで約250分の会話が可能
このプランから、クレジット超過時に追加購入(従量課金)が可能192kbpsの高音質出力や高度なクローンボイス機能が使える
Proプラン大量の音声コンテンツ制作やサービス運用に適したプラン
月500,000クレジットで約1,100分の会話が利用可能となっており、割安な追加クレジットも購入可能
API経由での44.1kHz PCM音声出力などプロ向け機能も利用可能
Scaleプラン月額330ドルの企業向けプランで、月2,000,000クレジットで約3,600分の会話が可能
Independent Publisher機能・カスタム音声保存・ユーザー管理機能が利用可能
追加クレジットもより割安で購入可能
Businessプラン月15,000分以上の通話を目的とする大規模利用向けプラン
​料金については個別見積もりで、大規模利用には割引が適用される
プラン専用サポートやオンプレミス導入などの企業向けサービスも受けられる
出典:https://elevenlabs.io/docs/conversational-ai/overview

トライアル利用から本格的な企業システムへの組み込みまで幅広くプランが用意されているので、目的や予算などに応じてプランを選択できます。

Conversational AIを無料で使える範囲

ElevenLabs Conversational AIは、会話型音声AIエージェントの開発環境であり、開発した会話型音声AIエージェントはElevenLabsの製品を利用しながら実行されます。

そのため、ElevenLabs Conversational AIのコストを考えるには、音声AIエージェント開発局面でのコストと、開発した音声AIエージェントの運用コストの2つを考えることが必要です。

まず、1番目の開発局面でのコストですが、ElevenLabs Conversational AIは無料で音声AIエージェント開発に使用できます

一方、運用時のコストですが、デバッグ・テスト・本運用を問わず、音声AIエージェントを実行すれば、費用が発生します。

実行時のコストは、料金プランで異なりますが、Freeプランであれば、無料で月10,000クレジットが付与され、約15分間の会話利用が可能です​。

ただし、Freeプランでは、Conversational AIで作成した音声AIエージェントの商用利用は不可となっています​。

そのため、Conversational AIの機能を試してみたり、Conversational AIでの音声AIエージェント開発の体験をしたりするためであれば、まず、Freeプランの無料枠を使ってみるとよいでしょう。

\ 無料プランでお試し /

ElevenLabs Conversational AIの活用法は?事例紹介

ElevenLabs Conversational AI

ElevenLabs Conversational AIは、会話型AIであり、さまざまな状況に柔軟に音声で対応できるため、多くのシーンでの活用が可能です。

ここでは、活用事例として以下の4ケースを紹介していきます。

  • カスタマーサポート
  • 音声コンシェルジュ・アシスタント
  • 教育・トレーニング
  • ナレーション・読み聞かせ

では、順に見ていきましょう。

カスタマーサポート

幅広い顧客からの問い合わせに 24 時間 365 日対応し、待ち時間を短縮して顧客満足度を向上させることが期待できます。

開発した音声AIエージェントは、問題解決・返品処理などに音声で対処していきます。

そして、これらの対処の中で、常に一貫したブランド固有の音声を保てるのが魅力です。

たとえば、FAQ(よくある問い合わせ)やマニュアルを学習させておけば、FAQに自動応答するカスタマーサポートAIとして、顧客からの質問に24時間対応し、オペレーターの負担を軽減することができます。

音声コンシェルジュ・アシスタント

スマートスピーカーや電話受付での音声アシスタントとしての利用が考えられます。

たとえば、ホテル・病院の電話受付を行い、内容に応じて、予約受付・案内を自動化することも考えられます。

教育・トレーニング

生徒のペースに合わせて対話する教育AIチューターとして、質問するとヒントを渡したり、会話形式で言語学習の教師として振る舞ったりすることが期待できます。

ナレーション・読み聞かせ

ユーザーの指示に応じて物語を朗読(ナレーション)するAIとしても使えます。

たとえば、問いかけに応じた音声ニュースの読み上げや、おとぎ話の子供への読み聞かせなどを、シーンに合わせた音声で語ることができます。

ElevenLabs Conversational AIのメリット

ElevenLabs Conversational AIを使って会話型音声AIエージェントを開発することで、さまざまなメリットが考えられます。

ここでは、以下の4つのメリットについて解説します。

  • 会話型音声AIエージェント開発の効率化
  • 専門知識の組み込みやカスタマイズが容易
  • エージェントの利用目的やシーンに合わせた音声の採用

会話型音声AIエージェント開発の効率化

ElevenLabs Conversational AIは、音声認識・音声合成・LLM・会話切り替えの機能を簡単に組み合わせてノーコードでも会話型音声AIエージェントを開発できます。

たとえば、数カ月かかる開発を大幅に削減すると謳われています。

また、自社システムなどに組み込むツールやAPIもさまざまに用意されており、スムーズな統合が可能です。

専門知識の組み込みやカスタマイズが容易

ElevenLabs Conversational AIでは、関連するドキュメントや外部リソースへのリンクをアップロードできます。

たとえば、顧客の問い合わせに的確に応答できるように、関連ドキュメント・FAQなどリソースをリンクさせることが可能です。

また、LLMとしては、ChatGPT・Gemini・Claudeの主要なモデルをサポートしており、簡単に切り替えができるようになっています。

これにより、エージェントの知識を常にアップデートすることが可能です。

会話型音声AIエージェントの利用目的やシーンに合わせた音声の採用

多彩な音声を含む音声ライブラリから、目的やシーンに合わせて、高品質で最適な音声を選択することができます。

また、音声に対して、感情表現も含めるようチューニングも可能です。

これにより、対話の相手が大人の場合と子供の場合で声のトーンを変えるといった柔軟な対応ができます。

さらには、31か国語に対応しており、日本語を選択すれば、日本語で人間と自然な対話をすることができます。

ElevenLabs Conversational AIのデメリット・留意点

ElevenLabs Conversational AIを利用する際には、以下の点に留意する必要があります。

  • 費用対効果の検討
  • 技術的なハードル
  • 運用上の留意点

では、それぞれの留意点を細かく見ていきます。

費用対効果の検討

高品質な音声や高度なLLMを使用すればより自然でユーザーフレンドリーなエージェントの構築が可能です。

一方、ElevenLabs Conversational AIは従量制の課金体系を採用しており、高品質な音声変換や音声合成、より精緻にチューニングされたLLMの採用などでは、エージェントの実行により多くのクレジットを消費してしまい、コスト負担が増大する可能性があります。

エージェント構築の目的やシーンに応じたプラン選択やコスト管理が大切です。

技術的なハードル

ElevenLabs Conversational AIでは対話型音声AIエージェントを簡単に構築可能ですが、より高度なエージェントの開発には技術力も必要となります。

運用上の留意点

運用に当たっては、ElevenLabsの利用規約の遵守が必須であり、「プライバシー保護」「著作権・知的財産権への配慮」「誤情報の拡散リスク」への対策も必要です。

ElevenLabs Conversational AIを使って対話型音声AIエージェントを構築する際は、コストや技術面だけでなく、運用面での留意点に配慮することが重要です。

まとめ

ここまで、ElevenLabsのConversational AIの概要から使い方、料金プラン、無料で使える機能までをわかりやすく解説し、あわせて、どんなシーンで活用可能か活用例も紹介してきました。

ElevenLabs Conversational AIは、Amazon Alexaなどと同じく、音声を使って人間と対話できるため、テキストに比べて感情などをより豊かに表現できます。

しかも、高品質な音声をシーンによって使い分けられることが特徴です。

無料で簡単にトライアルもできるので、ぜひ試してみてください。

\ 無料プランでお試し /

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次