OpenAI、GPT-4oで異なるキャラクター音声の生成が可能に

引用元:OpenAI

OpenAIは、GPT-4oの新たなデモ動画を公開しました。今回の新機能は、ユーザーのリクエストに対し、GPT-4oが複数の異なるキャラクターの声を生成するというものです。

デモ動画では、物語を書いているという男性が、GPT-4oにいくつかのキャラクターの声を練習させるシーンが公開されました。たとえば、洞窟の中にいる古き王のような雄大なライオンのイメージで「そこにいるのは誰だ?」と言ってほしいと伝えると、GPT-4oはそのイメージにぴったりな声を生成します。

他にも、洞窟に忍び込んだネズミや、賢く冷静なフクロウのキャラクター、低く狂気じみた悪役の笑い声など、様々な声を見事に再現しています。これらの声のトーン、抑揚、スピード、感情表現は、まるでプロの声優が演じているかのようなリアリティを感じさせます。

OpenAIによると、今後数週間以内に視覚機能と併せて展開される予定とのことです。

あわせて読みたい
OpenAIがChatGPT-4oを発表 OpenAIは5月13日に、新しい大規模言語モデル(LLM)「GPT-4o」を発表しました。GPT-4oは、これまでのフラグシップモデルであったGPT-4 Turboと同等の性能を持ちながらさらに高速化され、テキスト・音声・画像の理解力や、多言語対応力も大幅に向上しています。
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次