
Microsoftは、新たなゲーム生成AIモデル「Muse」を発表しました。このモデルは「World and Human Action Model(WHAM)」に基づいており、ゲームのビジュアルやプレイヤーの操作を生成することが可能です。
開発はMicrosoft Research Game IntelligenceおよびTeachable AI Experiencesのチームによって行われ、Xbox Game StudiosのNinja Theoryと共同で進められました。
今回の研究成果は、学術誌「Nature」に掲載されるとともに、Museのモデルのウェイトやサンプルデータがオープンソースとして公開されました。
これにより、研究者や開発者はAzure AI Foundryを通じてモデルの仕組みを学び、独自の実験を行うことが可能になります。
Museは、Xbox向けに開発されたオンライン対戦ゲーム「Bleeding Edge」のプレイデータを基にトレーニングされています。
このデータには7年以上にわたるゲームプレイが含まれており、10億以上の画像と操作データを学習しています。

プレイヤーが操作したキャラクターの動きやゲーム環境を分析し、それをもとに新たなプレイシーンを生成する能力を持ちます。
モデルの開発にあたり、Microsoftの研究チームは大規模な計算リソースを活用しました。
初期のトレーニングではV100 GPUを使用し、その後H100 GPUに移行することで、より高度なトレーニングが実現しました。
開発の過程では、AIモデルの学習過程を可視化しながら、徐々にゲームの物理演算やキャラクターの挙動を正確に再現できるよう改良が加えられました。
Museの評価基準として、「一貫性(Consistency)」「多様性(Diversity)」「持続性(Persistency)」の3つの指標が設けられています。
- 一貫性(Consistency)
-
生成されたプレイシーンが実際のゲームと同様の物理法則を維持しているかを示します。
- 多様性(Diversity)
-
同じ入力に対してさまざまなプレイ展開が生まれるかを評価する指標です。
- 持続性(Persistency)
-
ユーザーが追加したキャラクターやオブジェクトをAIが適切に反映し続けられるかを測定するものです。
さらに、研究チームはゲーム開発者との協力を進め、AIがクリエイティブなプロセスにどのように活用できるかを調査しました。
その一環として、「WHAM Demonstrator」というプロトタイプが開発されました。
これは、ユーザーが視覚的にAIと対話しながらゲームプレイの進行を生成・編集できるインターフェースです。
たとえば、ゲームのあるシーンを入力すると、Museがその先の展開を複数生成し、プレイヤーが選択できる仕組みになっています。
また、ユーザーがゲーム画面にキャラクターを追加すると、AIはそれを適切に反映し、新たな展開を生成できます。

Microsoftは、Museの技術が今後のゲーム開発に革新をもたらすと期待しています。
研究チームは、オープンソース化されたモデルがより多くの開発者に活用され、新たなゲーム体験の創出につながることを目指しています。
出典:Introducing Muse: Our first generative AI model designed for gameplay ideation – Microsoft Research