Google DeepMind ロボット向け新AIモデル「Gemini Robotics」を発表

出典:Gemini Robotics brings AI into the physical world – Google DeepMind

Google傘下のAI企業DeepMindは、新たなAIモデル「Gemini Robotics」と「Gemini Robotics-ER」を発表しました。これらのモデルは、ロボットが現実世界における多様なタスクをより効果的に遂行できるよう支援することを目的に開発されています。

今回発表されたGemini Roboticsは、DeepMindの最新モデルである「Gemini 2.0」を基盤に、ビジョン(視覚)、言語、アクション(行動)の各要素を統合し、物理的な行動を新しい出力として追加したことが特徴です。

そのため、従来特定の訓練を受けていなかった作業でも状況を理解し、臨機応変に対応できるようになりました。具体的には、紙を折りたたんだり、ボトルのキャップを外したりといった精密な動作を、状況に応じて柔軟にこなすことが可能だということです。

また、Gemini Robotics-ERは、視覚と言語による情報を用いて、高度な空間理解や複雑な推論を行う能力を備えています。このモデルでは、例えば、ランチボックスの中身を効率よくパッキングするなど、物体の配置や操作に関する高度な判断を行うことができます。

出典:Gemini Robotics brings AI into the physical world – Google DeepMind

安全面においても、DeepMindはモデルが行動の安全性を評価し、実行前にリスクを的確に判断できるよう訓練しています。同社はさらに、Apptronikと提携して次世代型ヒューマノイドロボットの開発も進めています。

また、Agile Robots、Agility Robotics、Boston Dynamics、Enchanted Toolsといった企業とも協力し、より知的で応答性の高いロボットの実現を目指しているとのことです。

DeepMindは、これらの取り組みを通じて、ロボットが幅広い環境や用途に柔軟に適応し、さまざまな現実世界のタスクを実行できるようになると期待しています。


出典:Gemini Robotics brings AI into the physical world – Google DeepMind

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次