
Google傘下の人工知能研究企業であるGoogle DeepMindは、テキストプロンプトを入力するだけで、リアルタイムに操作可能な仮想世界を生成できる新たなAI技術「Genie 3(ジーニー3)」を発表しました。
Genie 3は、従来のAI生成技術の枠を超え、ユーザーが単一のテキストプロンプトを入力するだけで、対話や操作が可能な仮想空間を即座に創り出します。
What if you could not only watch a generated video, but explore it too? 🌐
— Google DeepMind (@GoogleDeepMind) August 5, 2025
Genie 3 is our groundbreaking world model that creates interactive, playable environments from a single text prompt.
From photorealistic landscapes to fantasy realms, the possibilities are endless. 🧵 pic.twitter.com/P0cwFvf5d2
この技術を活用すると、AIエージェントが仮想世界内で経験を積み、自律的に学習や成長を遂げることが可能になります。また、ロボットが実際の世界に導入される前に、シミュレーション上で安全な訓練を行う用途にも期待が集まっています。
Genie 3の大きな特長は、リアルタイムかつインタラクティブな生成能力です。具体的には、720pの解像度で毎秒24フレームという動的で滑らかな仮想空間を生成し、ユーザーの行動に応じてリアルタイムに環境を変化させることができます。
🔘 Real-time capabilities
— Google DeepMind (@GoogleDeepMind) August 5, 2025
Genie 3 is our first world model to allow live interaction, while also improving consistency and realism compared to Genie 2. It can generate dynamic worlds at 720p and 24 FPS, with each frame created in response to user actions. pic.twitter.com/pGc0QbG7et
また、一度生成された環境は数分間にわたり一貫性を維持するほか、最大1分前の状態まで視覚的な記憶を保持することが可能となりました。
🔘 Long-horizon consistency
— Google DeepMind (@GoogleDeepMind) August 5, 2025
Environments created remain largely consistent over several minutes, with visual memory extending as far as 1️⃣ minute in the past.
This ability is critical to enable AI agents to learn about the world, and provides humans with an immersive… pic.twitter.com/XUDQtKRg7i
さらにユーザーは、単に環境内を移動するだけでなく、追加のテキストプロンプトを用いて天候の変更や新たなキャラクターの導入といった、仮想世界のリアルタイムな変化を引き起こすこともできます。これにより、ユーザーが能動的に参加する没入型の新しい体験が生まれます。
🔘 Promptable world events
— Google DeepMind (@GoogleDeepMind) August 5, 2025
Beyond navigation, users can insert text prompts to alter the world in real-time – like changing the weather ⛅ or introducing new characters 👤
This unlocks a new level of dynamic interaction. pic.twitter.com/vvy9U2KOav
AIの研究開発分野でもGenie 3の活用が期待されています。実際にGoogle DeepMindは、自社開発のAIエージェント「SIMA」を仮想世界に配置し、目的を持たせてシミュレーションを実施しました。その結果、エージェントは世界の中で自主的に行動し、環境からの反応を通じてより高度な学習を行えることが確認されています。これにより、AIエージェントが将来的に現実世界で複雑な問題に対応するための能力向上に役立つと見込まれています。
🔘 Accelerating agent research
— Google DeepMind (@GoogleDeepMind) August 5, 2025
To explore the potential for agent training, we placed our SIMA agent in a Genie 3 world with a goal. The agent acts, and Genie 3 simulates a response in the world without knowing the objective. This is key for building more capable embodied… pic.twitter.com/0y91mhzlnd
Genie 3は将来的に、エンターテインメントや教育分野での利用も視野に入れています。例えば、恐竜の視点から古代ギリシャを冒険したり、救助活動のシミュレーションを通じて計画策定を学ぶなど、多彩な体験が可能になります。
現在、Google DeepMindは限定された研究者やクリエイターに向けて先行してGenie 3へのアクセスを提供していますが、今後さらに対象を拡大する計画を検討中です。Genie 3の登場は、AIエージェントが無限にシミュレーション環境で訓練可能な時代の到来を意味するとともに、汎用人工知能(AGI)の実現に向けた重要な一歩として期待されています。
出典:Genie 3: A new frontier for world models – Google DeepMind