Google DeepMind 正式推出 Gemini Robotics-ER 1.6 ,这是其面向机器人领域打造的推理模型最新迭代。该模型专注于提升机器人的空间感知与物理推理能力,使其能够更准确地理解和交互周边环境。
Gemini Robotics-ER 1.6 在视觉和空间理解方面实现了显著突破,机器人借此能够完成更复杂的任务规划和执行。该模型的突出特性在于能够解读模拟仪器读数,例如压力表和视镜,这一功能是 Google DeepMind 与 Boston Dynamics 合作开发的成果。此外,模型支持通过 Gemini API 和 Google AI Studio 进行任务规划,并可整合 Google Search 及第三方工具调用,成为自主智能体运行的关键推理层。
该版本现已向开发者开放,用户可通过 Gemini API 和 Google AI Studio 获取使用,官方同时提供示例代码以降低集成门槛。首批应用场景主要面向工业、商业及研究领域,旨在协助机器人和研究团队构建或升级物理智能体。测试数据表明,相比 Gemini Robotics-ER 1.5 以及 Gemini 3.0 Flash ,新版本在精准指向、物体计数、物理任务成功检测等项目上均有明显提升。早期参与测试的研究人员反馈,该模型的能力边界得到有效扩展,部分此前难以处理的现实环境任务现已能够得到解决。
Google DeepMind 持续深化具身推理领域的投入,折射出其志在为机器人自主性树立新标杆的战略意图。公司正充分调动其在人工智能和机器人技术方面的积累,试图突破物理推理的技术瓶颈,加快智能体在数字与物理空间协同部署的进程。


