Google DeepMind 正式推出 Gemini Robotics-ER 1.6 ,这是一款专为机器人应用设计的推理优先模型升级版本。通过增强空间逻辑和多视角理解能力,该模型使机器人能够以前所未有的精度感知和理解周围环境。
Gemini Robotics-ER 1.6 在多项关键技术指标上实现突破。在视觉和空间理解方面,模型能够准确解析复杂的三维场景;在任务规划领域,系统可自主生成并执行多步骤操作序列;在成功检测环节,模型能够实时评估任务完成状态并做出相应调整。
值得关注的是,这款模型还新增了仪器读数能力,可读取复杂的工业仪表和视镜。这一功能的实现得益于与 Boston Dynamics 的深度合作。 Boston Dynamics 在足式机器人领域的丰富经验,为模型在非结构化环境中的适应性提供了重要支撑。
安全性能方面, Gemini Robotics-ER 1.6 同样达到新高。测试数据显示,该模型在应对对抗性空间推理任务时,展现出对安全策略的卓越遵从能力,目前已成为 Google 最安全的机器人模型。
即日起,开发者可通过 Gemini API 和 Google AI Studio 访问该模型。
创艺洞察
Gemini Robotics-ER 1.6 的发布,标志着大语言模型向物理世界渗透的进程正在加速。与单纯追求语言能力的参数竞赛不同, Google 选择了一条更务实的路径,将空间智能作为切入点。仪器读数能力的加入尤其值得注意,它意味着机器人在工业场景中的落地不再是理论构想。然而,从展示能力到可靠部署之间,仍横亘着漫长的调试与优化周期。 Boston Dynamics 的参与或许正是为了弥补这一断层。后者在真实环境部署方面的积累,恰是互联网公司所缺乏的。


