MetaのAI部門トップ、ヤン・ルカン氏は、人間レベルのAIを実現するためには「世界モデル」が必要であると主張しています。
2024年10月に行われたHudson Forumでの講演で、ルカン氏は現在のAI技術に対する楽観的な見方に釘を刺し、人間のように世界を理解し、計画を立てるには、まだ時間が必要だと指摘しました。
彼はこのようなAIを実現するためには「世界モデル」が鍵であり、少なくとも10年ほどかかる可能性があると予測しています。
現在のAI、特に大規模言語モデル(LLM)や画像・動画モデルは、次の単語やピクセルを予測することに特化しているものの、三次元的な物理的世界の理解には限界があります。
ルカン氏は、AIが膨大なデータを用いても、人間が短時間で学習するタスク、例えば食卓の片付けや車の運転を正確に実行できない点を強調しました。
そこで登場するのが「世界モデル」です。
このモデルはAIが現実世界をより深く理解し、未来の出来事や行動の結果を予測できるようにするための新しいアーキテクチャです。
たとえば、散らかった部屋を見たとき、AIはどのように片付けるべきかを即座に予測し、最適な行動を取れるようになります。
人間のように空間を三次元的に認識し、最適な行動を取るための計画を立てる能力が、AIに求められるのです。
「世界モデル」は従来のLLMよりも多くのデータを必要とし、その分、計算リソースが膨大です。
このため、クラウドプロバイダーとAI企業の提携が加速している背景があります。
すでにスタートアップの中には「世界モデル」に基づくAI開発に取り組んでいる企業も存在します。
たとえば、著名なAI研究者フェイフェイ・リー氏とジャスティン・ジョンソン氏が率いる「World Labs」は、2億3000万ドルの資金を調達しました。
また、OpenAIも未発表の動画生成AI「Sora」を「世界モデル」として説明しています。
MetaのAI研究所であるFAIR(Fundamental AI Research)もこの技術に注力しており、目的駆動型AIの開発を進めています。
FAIRは、以前はMeta製品向けのAI開発を行っていましたが、現在は長期的な研究に専念しており、大規模言語モデルを用いない方向にシフトしているとルカン氏は述べました。
しかし、ルカン氏は「世界モデル」の実現には多くの課題が残っているとし、その開発が成功するまでには少なくとも数年、場合によっては10年を要する可能性があると警告しています。
MetaのCEOであるマーク・ザッカーバーグ氏も「AGI(人工汎用知能)がいつ実現するのか」と質問し続けていますが、現時点では明確な答えは得られていないようです。
「世界モデル」はAIの進化にとって大きな可能性を秘めていますが、その実現にはまだ時間がかかるとルカン氏は強調しています。それでも、この技術はAI業界で今後も注目され続けるでしょう。