アメリカのAI研究企業であるOpenAIは、ChatGPTの有料版ユーザーの一部に、より自然でリアルタイムな会話を実現する高度な音声機能の提供を開始しました。
この機能により、ユーザーはいつでも会話を中断したり、AIが感情を理解して応答したりすることが可能になります。
これは、ユーザーにとってより直感的でインタラクティブな体験を提供することを目指しています。
OpenAIは、テストに参加するユーザーをメールやアプリ内の通知で順次招待し、今年の秋までにはすべての有料版ユーザーが利用できるようにする予定です。
また、ビデオ通話や画面共有機能も今後追加される予定です。
OpenAIは、この機能を初めて公開した時から、安全性と品質の向上に力を入れてきました。
より多くの人に安心して使ってもらえるよう、100以上の外部チームと協力して45の言語で音声機能のテストを実施しました。
プライバシー保護の観点から、モデルはあらかじめ設定された4種類の音声で話すように設計されており、それ以外の声色で発話することはできません。
また、暴力的な内容や著作権に違反するコンテンツの要求をブロックする仕組みも導入されています。
今回のテストで得られた知見は、音声機能をより安全で快適なものにするために活用されます。
OpenAIは、8月上旬にGPT-4の機能、制限、安全性評価に関する詳細なレポートを公開する予定です。
出典:OpenAI / X