谷歌DeepMind发布了两款基于Gemini 2.0的新型AI模型——Gemini Robotics和Gemini Robotics-ER,旨在让机器人更好地理解、行动和响应物理世界。
* Gemini Robotics:是一款先进的视觉-语言-动作(VLA)模型,通过将物理动作作为新的输出模态,直接控制机器人。在综合泛化基准测试中,其性能比其他最先进的VLA模型提升超过两倍。
* Gemini Robotics-ER:是一款具有高级空间理解能力的Gemini模型,使机器人专家能够利用Gemini的具身推理(ER)能力运行自己的程序。
这些模型使各种机器人能够执行比以往更广泛的现实世界任务。谷歌DeepMind正与Apptronik合作,利用Gemini 2.0构建下一代人形机器人。同时,Gemini Robotics-ER也向包括Agile Robots、Agility Robots、Boston Dynamics和Enchanted Tools在内的受信任测试者开放。
(HackerNews)
via 茶馆 - Telegram Channel