
最近注目を集めているAIチャットサービス「ChatGPT」に、新たな進化を遂げる「アドバンスドボイスモード」が登場しました。
この機能は、従来のテキストチャットに加えて音声でのやり取りが可能になり、ユーザーの体験をさらに豊かにしてくれるものです。
特に、音声を使った自然な会話やリアルタイムでの情報共有が求められる場面で、その真価を発揮します。
また、「画面共有」や「ビデオ通話」といった新しい機能も追加され、リモートワークやオンライン学習にも活用の幅が広がっています。
ChatGPTのアドバンスドボイスモード(Advanced Voice Mode)とは?

ChatGPTのアドバンスドボイスモードは、従来のボイスモードに比べて音声表現力や会話速度がさらに向上し、より自然な対話が可能になっています。
加えて、9種類の音声から選択できるほか、メモリー機能やカスタム指示を活用することで、ユーザーのニーズに合わせた柔軟な対応ができるのも大きな魅力です。
それでは、アドバンスドボイスモードの詳細について見ていきましょう。
人間のように会話が可能
ChatGPTのアドバンスドボイスモードは、テキストに加えて音声による自然な対話を実現します。
抑揚や感情を人間らしく表現し、細かいニュアンスまで理解するため、実際に人と話しているようなリアルなコミュニケーションが可能です。
例えば、方言を使った会話や、過去のやり取りを踏まえた返答ができるため、より親しみやすいやり取りが実現します。
従来のボイスモードに比べ、会話のスピードも人間に近く、発音やトーンといった音声の表現力も強化されています。
このため、カジュアルな日常会話からビジネスでの応対まで、さまざまなシーンで柔軟に活用できるのが特徴です。
9種類のボイスから選べる
ChatGPTのアドバンスドボイスモードでは、男性の声が5種類、女性の声が4種類、計9種類のボイスから選ぶことができます。
それぞれのボイスによって性格も違い、元気な声や落ち着いた声など、用途に応じて変更することができます。

例えば、カジュアルな会話や教育の場では親しみやすい声を、ビジネスの場では、落ち着いた信頼感ある声を選択すると、よりニーズに合った出力になるでしょう。
カスタム指示(Custom instructions)が使える
ChatGPTのアドバンスドボイスモードでは、カスタム指示(Custom Instructions)機能を活用することができます。
これは、使用者がChatGPTに特定の情報を提供したり、求める回答のスタイルや内容について指示を出すことができる機能です。
例えば、あるユーザーが「クライアント向けに常に丁寧で専門的なトーンで応答してほしい」と設定した場合、以降そのユーザーに対してChatGPTはそのトーンを維持して返答します。


メモリー機能が使える
メモリー機能とは、ChatGPTがチャットの中から重要と判断した情報を自動で記録し、次回以降のチャットでその情報を参考にする機能です。

設定画面から記録された内容を確認できるだけでなく、「この情報をメモリーに記録してください」といった具体的な指示を出して、必要な情報を保存することも可能です。
これにより、継続的なやり取りで一貫性を持たせることができ、よりスムーズなコミュニケーションが実現します。

画面共有機能が使える
アドバンスドボイスモードでは、画面共有機能が統合されており、従来のテキストや音声のやり取りに加え、リアルタイムで画面を共有することが可能です。
以下のデモは、「このメッセージの返信を手伝ってほしい」と画面共有を使って依頼する様子です。
Screenshare while using Advanced Voice for instant feedback on whatever you’re looking at. pic.twitter.com/d4Xm36dwOX
— OpenAI (@OpenAI) December 12, 2024
この機能は、プレゼンテーションや共同作業、技術サポートの場面で特に役立ちます。
たとえば、リモートでのプロジェクトレビューやアプリの使用方法を説明する際に、ユーザーが画面を直接見せながら詳細を伝えられるため、よりスムーズなコミュニケーションが実現します。
ビデオ会話機能が使える
さらに、ビデオ会話機能も新たに追加されました。
この機能により、ユーザーはChatGPTを通じてビデオ通話を行い、視覚的な情報も含めたコミュニケーションが可能になります。
以下のデモでは、「コーヒーの淹れ方を教えて」とビデオで映像を送りながら質問する様子です。
Now you can chat with ChatGPT over video and voice in real time. pic.twitter.com/6LySLJcFy5
— OpenAI (@OpenAI) December 12, 2024
特に音声だけでは伝えにくいニュアンスや表情が重要な場面で役立ちます。
たとえば、オンライン面接やカジュアルな会議、遠隔地にいるチームメンバーとの打ち合わせなど、柔軟な用途に対応できるのが魅力です。
検索機能が使える
さらに便利なのが、リアルタイム検索機能の追加です。
この機能では、チャット中に最新の情報やデータをリアルタイムで検索し、会話に活用することが可能です。

これにより、一般的な会話から、最新ニュースや技術情報を即座に共有できる高度な対話が実現します。
たとえば、打ち合わせ中に必要な統計情報をその場で調べたり、最新のトレンドを会話に反映したりする際に非常に便利です。
ChatGPTのアドバンスドボイスモードは無料でも使える

リリース時、ChatGPTのアドバンスドボイスモードは有料プラン向けのみの提供でしたが、現在は無料プランのユーザーでも利用が可能です。
Starting this week, Advanced Voice is rolling out to all ChatGPT Enterprise, Edu, and Team users globally. Free users will also get a sneak peek of Advanced Voice.
— OpenAI (@OpenAI) October 1, 2024
Plus and Free users in the EU…we’ll keep you updated, we promise.
ただし、新機能を利用するには、ChatGPTアプリの最新版へのアップデートが必要で、現時点では画面共有機能、ビデオ会話機能、検索機能はChatGPT PlusおよびProユーザーのみに公開されています。
機能としてはかなり少ないため、日常的に活用するというよりかは、使い勝手を試してみるという利用用途になりそうです。
ChatGPTのアドバンスドボイスモードの使い方

ChatGPTのアドバンスドボイスモードは、スマートフォンのスマホアプリ版で利用できます。
まだ使ったことがない方は、アプリを最新版にアップデートしてから始めてください。
アドバンスドボイスモードで会話をする方法
スマートフォンでChatGPTアプリを起動し、画面右下のアイコンをタップして、アドバンスドボイスモードの画面を開きます。

アドバンスドボイスモードを使う前に、使用するボイスを選択しましょう。
9種類のボイスが用意されており、それぞれに異なる性格が設定されています。

選択したボイスは後から変更可能です。
変更したい場合は左上のマークから設定を開き、

音声を選択後「完了」をクリックします。

画面に空模様のアイコンが表示されたら、ChatGPTと音声での会話を始める準備が完了です。
音声で質問を投げかけると、ChatGPTが応答します。

ChatGPTとの音声でのやり取りは、全てチャット形式で文章として自動的に記録されるため、後で確認したい時にも便利です。

チャットは、アドバンスドボイスモードを閉じると、自動的に表示されます。
アドバンスドボイスモードで画面共有をする方法
ChatGPTアプリのチャット入力欄横にある音声アイコンをタップして、音声モードを有効にします。

音声モードの画面で、右から2番目の「・・・」アイコンをタップし、

表示されるメニューから「画面を共有する」を選択します。

「画面共有」を選択すると、画面共有の確認画面が表示されます。

ここで「ブロードキャストを開始」をタップすると、画面共有が開始されます。

アドバンスドボイスモードでビデオ会話をする方法
ChatGPTアプリのチャット入力欄横にある音声アイコンをタップして、音声モードを有効にします。

音声モードの画面で、左下のビデオアイコンをタップすると、カメラが起動し、ビデオ会話が開始されます。

アドバンスドボイスモードで検索機能を使う方法
ChatGPTアプリのチャット入力欄横にある音声アイコンをタップして、音声モードを有効にします。

アドバンスドボイスモードが起動したら、ChatGPTに対して音声で質問や検索したい内容を話しかけてください。
ChatGPTは音声入力を解析し、関連する情報を提供します。
会話中は検索を行っているか画面上で確認を取ることはできませんが、会話終了後のチャット画面を見ると検索を行いソースを表示してくれていることが分かります。

必要に応じて、追加の質問や詳細を尋ねることも可能です。
ChatGPTのアドバンスドボイスモードの活用事例

ChatGPTのアドバンスドボイスモードは、リアルタイムでの翻訳や英語学習、さらには製品紹介サービスの作成など、幅広い用途で活用することができます。
例えば、リアルタイム翻訳では、スムーズなコミュニケーションを支え、英語学習では異なるアクセントを使ってリスニング力を向上させることが可能でしょう。
それぞれの活用方法について具体的にご紹介していきます。
リアルタイム翻訳
ChatGPTのアドバンスドボイスモードを使えば、リアルタイムでの翻訳が可能です。
まるで人が翻訳しているかのように、自然な会話の流れを保ちながら正確に言語を変換してくれるため、コミュニケーションがスムーズに進みます。
さらに、バックグラウンド再生が可能なため、他のアプリを使用しながらでも会話を続けられます。
このボイスモードは数多くの言語だけでなく、特定の方言にも対応しており、さまざまな場面で幅広く活用できるでしょう。
英会話などの語学学習
ChatGPTのアドバンスドボイスモードでは、9種類の音声から選べるため、異なるアクセントを聞き分けながらリスニングの練習ができます。
Toeicなどテスト対策としても使える他に、飛行機内やレストランでのロールプレイング、仕事相手との想定問答など、実際のシチュエーションに基づいた会話練習が可能です。
さらに、ChatGPTは発音や表現に対してフィードバックを提供してくれるため、それを繰り返し聞くことで改善し、英語力を大幅に伸ばせます。
自分のペースで英語を学べ、忙しい日常でも効率的な語学習得が期待できるでしょう。

音声紹介サービスの作成
ChatGPTのアドバンスドボイスモードを活用することで、自社製品を音声で紹介するサービスを手軽に作成できます。
例えば、製品ページに「音声で聞く」ボタンを設置し、訪問者が製品の説明を音声で楽しめるようにするのが一般的な方法です。
まずはChatGPTで紹介文を作成し、アドバンスドボイスモードでその文章を音声に変換します。
最後に、Webサイトやアプリに音声再生機能を追加し、訪問者がワンクリックで音声による紹介を聞けるようにしましょう。
これにより、視覚的な情報に加えて耳にも訴えかけることで、顧客の関心をさらに引きつけることができます。
まとめ
ChatGPTのアドバンスドボイスモードは、リアルな会話体験を提供し、翻訳や語学学習、製品紹介まで多岐にわたる用途で活用できます。
特に9種類のボイスやカスタム指示機能が、ユーザーのニーズに応じた柔軟な対応を可能にします。
有料プランでのみ利用可能ですが、その高度な機能は多くの場面で役立つでしょう。
ぜひ、ChatGPTのアドバンスドボイスモードを試して、業務や学習にお役立てください。