OpenAIは、GPT-4oの新たなデモ動画を公開しました。今回の新機能は、ユーザーのリクエストに対し、GPT-4oが複数の異なるキャラクターの声を生成するというものです。
デモ動画では、物語を書いているという男性が、GPT-4oにいくつかのキャラクターの声を練習させるシーンが公開されました。たとえば、洞窟の中にいる古き王のような雄大なライオンのイメージで「そこにいるのは誰だ?」と言ってほしいと伝えると、GPT-4oはそのイメージにぴったりな声を生成します。
他にも、洞窟に忍び込んだネズミや、賢く冷静なフクロウのキャラクター、低く狂気じみた悪役の笑い声など、様々な声を見事に再現しています。これらの声のトーン、抑揚、スピード、感情表現は、まるでプロの声優が演じているかのようなリアリティを感じさせます。
OpenAIによると、今後数週間以内に視覚機能と併せて展開される予定とのことです。