OpenAIが、動画生成モデル「Sora」の新バージョンをトレーニング中で、より高速かつ高品質な動画生成を目指していると米メディアのThe Informationが報じました。
今年2月に初めてデモが公開され、多くの注目を集めましたが、正式リリースは未だ実現していません。
Soraの開発に関わる関係者によると、新バージョンでは、クリップの生成速度が大幅に向上し、より長いクリップを短時間で生成できることを目指しているとのことです。
初期バージョンでは、約1分間のクリップを作成するのに10分以上かかり、操作が煩雑で、クリエイターが使いやすいモデルとは言い難いものでした。
また、動画の中でキャラクターやオブジェクトのスタイルを一貫して保つことが難しく、物理的に不自然な動きや、キャラクターの解剖学的ミスも散見されていました。
新バージョンのSoraをトレーニングするために、OpenAIは数百万時間に及ぶ高解像度の動画を収集しており、これらのデータは多様なスタイルやテーマを含むものが求められています。
ただし、特定のジャンルやスタイルに偏ったデータセットは、生成された動画にも偏りをもたらす可能性があるため、データのバランスが重要な課題となっています。
このように、Soraの開発は進んでいるものの、製品のリリースが遅れている背景には、企業が急いでデモを公開する一方で、商業利用に十分な完成度を持たない状態で市場に出すケースが増えていることが関係しています。
Soraの遅延は、OpenAIが競争の激しいAI市場での注目を維持しつつも、商業的に成功するために慎重な開発を行っていることを示しています。
一方、映画業界やクリエイターたちは、Soraの進化に大きな期待を寄せていますが、Soraのリリースが遅れている間に、他のAI動画生成ツールが普及しています。
例えば、映画会社LionsgateがAIツールRunwayと提携するなど、AIを利用した動画制作がすでに進展しており、Soraがこれらの競合にどう対抗するかが注目されています。
Soraの新バージョンが商業的にリリースされれば、AI動画生成の分野に新たな革新をもたらす可能性がありますが、OpenAIが慎重に改良を重ねているため、その正式発表がいつになるかは依然として不透明です。