谷歌 DeepMind 公布能生成可互动环境的世界模型 Genie 2谷歌 DeepMind 推出第二代 Genie 模型，其可以根据单个图像和文本描述生成交互式实时 3D 世界场景

谷歌 DeepMind 公布能生成可互动环境的世界模型 Genie 2

谷歌 DeepMind 推出第二代 Genie 模型，其可以根据单个图像和文本描述生成交互式实时 3D 世界场景。以 Genie 世界模型作为基础模型，可以为自动驾驶或具身人工智能生成无限多的训练数据，进一步推动 AI 发展。

Genie 2 可以生成“丰富多样的 3D 世界”，其中包括用户可以使用鼠标或键盘进行跳跃和游泳等动作的世界。该模型经过视频训练，能够模拟物体交互、动画、灯光、物理、反射和“NPC”的行为，并拥有记忆能力。在谷歌公布大量示例中，许多看起来都像 3A 游戏，原因很可能是该模型的训练数据包含热门游戏的通关视频。

—— TechCrunch，Google 博客

via 风向旗参考快讯 - Telegram Channel