
米xAIは、画像から動画を生成する新モデル「Grok Imagine Video 1.5」を発表しました。同社によると、同モデルはリアリズムの鮮明さ、物理表現、生成速度を高めた画像生成動画モデルで、すでにxAI APIで一般提供されています。APIでは「grok-imagine-video-1.5」として利用でき、開始画像を入力したうえで、動きの内容や解像度、動画の長さを指定して映像を生成できます。
Grok Imagine Video 1.5 is here
— xAI (@xai) June 17, 2026
Our new image-to-video model with sharper realism, better physics and faster generations 🧵https://t.co/zGhs9czkC5 pic.twitter.com/9X4YicpMH8
一般ユーザー向けには、grok.com/imagineとiOS、Androidアプリで「Video 1.5 Fast」も展開されました。xAIは、Grok Imagine Video 1.5とVideo 1.5 Fastについて、同社のこれまでの画像生成動画モデルの中で最も優れたものだと説明しています。従来モデルと比べ、モーション、物理表現、音声、速度の各面を改善したことが特徴です。
音声面では、効果音や環境音、会話音声を映像と同じ生成プロセス内で作成し、アクションに合うように出力します。スピーチはより明瞭になり、映像との同期も改善されました。モーションと物理表現では、クリップ全体を通じた動きの一貫性が高まり、ゆがみを減らしながら、物体や人物の重さ、勢いをより自然に表現できるようになったということです。
速度面では、Video 1.5 Fastが生成時間を大きく短縮しました。6秒・720pの動画は、従来モデルでは40秒以上かかっていましたが、新モデルでは約25秒で生成できるとしています。動画生成AIでは、品質だけでなく試行回数を増やせる速度も制作効率に直結するため、待ち時間の短縮はクリエイターや企業の利用にとって重要な改善となるでしょう。
また、xAIはGrok Imagine Video 1.5の公開にあわせ、制作ワークフローを支援する新機能も順次展開します。制作物をプロジェクト単位で整理できる「Projects」、複数のエージェントを並行して実行できる「Multiple agents」、過去に生成した画像や動画をライブラリから探せる「Search」が追加されます。これにより、1つの生成結果を待ってから次の作業に移るのではなく、複数のプロンプトを同時に走らせながら、生成物を管理しやすくなります。
参照元では、David Thompson氏がGrok Imagine 1.5だけを使い、映画の予告編のような映像を制作した事例も紹介されています。xAIは、Video 1.5を単なる高速化モデルではなく、音声、動き、物理表現、作業管理を含めた動画制作環境の強化として位置付けています。
