Gemini Robotics-ER 1.6 ：通过增强具身推理赋能现实世界机器人任务

Google DeepMind 正式推出 Gemini Robotics 系列模型，标志着这家科技巨头在具身智能领域迈出关键一步。该模型延续 Gemini 家族在多模态理解和推理方面的优势，旨在解决具身智能的两大瓶颈：复杂环境泛化能力和长周期任务连贯性。 Google 意在抢占行业标准制定者位置，其优势在于成熟的多模态研发体系、充足算力及 Android 生态的边缘部署经验。真正的悬念在于开发者社区能否基于此模型推出超越实验室 demo 的实用应用。

发布于2026年4月15日 13:35

编辑小创

评论0 条

阅读61

#具身智能 #Google #Gemini

Gemini Robotics ： Google 再次布局具身智能

Google DeepMind 正式推出 Gemini Robotics 系列模型，标志这家科技巨头在具身智能领域迈出关键一步。

从技术演进路径来看， Gemini Robotics 并非 Google 首次涉足机器人领域。 2023 年， Google 推出的 RT-2 （ Robotics Transformer 2 ）已经展示了视觉-语言-动作模型在操控任务中的潜力。此次推出的 Gemini Robotics 系列，被视为该技术路线在底层模型能力上的重大升级。核心看点这款专为机器人场景优化的多模态模型，延续了 Gemini 家族在理解和推理方面的优势。开发者社区普遍关注的是其能否解决此前具身智能面临的两大瓶颈：复杂环境下的泛化能力，以及长周期任务中的动作连贯性。

商业前景

具身智能被视为 AI 落地的下一个重要方向。 Tesla 的 Optimus 、 Figure 的 Figure 01 、 1X 的 NEO Beta 等产品相继曝光，显示资本正加速向人形机器人赛道聚集。 Google 此时推出专用模型，意在抢占行业标准制定者的位置。

从产业格局判断， Google 的优势在于：成熟的多模态模型研发体系、充足的算力资源，以及 Android 生态积累的边缘部署经验。若 Gemini Robotics 能够将模型推理延迟压缩至实时控制可接受的范围内，其商业化空间将相当可观。

创艺洞察

具身智能赛道正从“概念验证”迈向“工程落地”阶段。 Google 此时入局，时机耐人寻味，既非最早，也不是最激进。这家搜索巨头似乎在等待一个信号：多模态大模型的能力边界已经足够支撑物理世界的交互需求。 Gemini Robotics 的推出，本质上是一份答卷，也是一封挑战书。真正的悬念在于，半年之内，开发者社区能否基于这套模型跑出超越实验室 demo 的实用案例。

GPT-5.6 发布当天 OpenAI 自曝 SWE-Bench Pro 30% 有问题

OpenAI 在发布 GPT-5.6 当日指出 SWE-Bench Pro 约 30% 任务存在缺陷，引发对 AI 基准测试可靠性的质疑。多项研究进一步揭示，验证器质量决定模型学习方向，基准题目高度冗余，且模型“窄能力”提升未必转化为真实经济产出的“宽能力”。当前 AI 进步尚未达到自维持加速阈值。基准测试正面临结构性危机，其公信力受利益冲突影响，亟需建立独立第三方验证机制以确保评估客观性。

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

OpenAI 旗下 GPT-5.6 Sol Ultra 通过 64 路并行 agent 在 1 小时内生成了图论 CDC 猜想的证明文本，成本不足 500 美元。该成果引发争议，因缺乏 Lean 机械化验证、未公开完整推理轨迹及受限于图论形式化库不成熟，数学界对其有效性存疑。此事表明 LLM 已具备启发式数学搜索能力，但验证基础设施滞后仍是瓶颈。未来“多路并行+防放弃 prompt”或成范式，而完善 Lean 工具链是确立 AI 证明可信度的关键。

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

针对复杂疾病治疗难题，Arc 研究所正利用 AI 构建通用“虚拟细胞”模型。该模型将 RNA 表达视为生命语言，计划四年内通过 CRISPR 和单细胞测序完成 10 亿次实验进行训练。研究人员可借此在电脑模拟中预测基因或化学干预方案，实现从盲目猜测到精准预测的转变。该工具将于今年晚些时候开源，有望在未来四五年内推动个性化医疗及复杂疾病治疗取得临床突破。

#AI 与健康

阅读全文

互动讨论