在机器人技术持续推进的今天,如何让机器真正适应和理解人类生活环境,是一个关键而现实的挑战。Figure 公布了 Project Go-Big 项目,为这一目标带来了新的突破。这个项目的核心,是用互联网规模的人类视频数据预训练类人机器人,并实现了人类行为到机器人行为的直接迁移。这种方式,有望彻底改变机器人学习和应用的范式。

长期以来,机器人学习依赖于人工示范、精细编程或者在高度可控的环境下采集数据。然而,这些方式不仅成本高昂,而且很难反映真实世界的多样性和复杂性。类人机器人由于形态和运动方式与人类高度相似,天然适合借鉴人类的行为。Project Go-Big 正是基于这一点,通过收集日常生活中人们自然而然的操作和行为,积累了前所未有的训练素材。特别是与 Brookfield 的合作,让 Figure 能够在全球超过十万套住宅、亿级平方英尺的各种空间中,采集到丰富的、真实的家庭生活数据。这意味着,机器人不再只是在实验室里学习标准动作,而是从千家万户的日常中汲取经验。

在数据预训练的基础上,Helix 模型实现了一个令人瞩目的里程碑。机器人可以仅凭人类视角视频的学习成果,实现无示范、无专门机器人数据的 “零样本” 导航。换句话说,机器人通过观察人类如何在家中穿行、避障、完成目标,就能理解并执行诸如 “去开冰箱”、“走到厨房桌子旁” 这样的口头指令,自动生成行动策略。这种从像素到低层次控制命令的端到端学习,过去只在视觉、语言领域取得过突破,如今首次在机器人导航和操作任务中落地。

更进一步,Helix 现在已经可以将操控和导航融为一体,由同一个网络同时输出灵巧操作和空间移动的控制信号。这意味着未来的家庭机器人,不需要针对不同任务切换系统,可以用自然语言与用户交流,灵活处理复杂环境下的各种事务。数据和模型的统一,让机器人具备了更强的泛化和适应能力,也为大规模部署打下了基础。
而这一切的背后,是 Figure 对大规模、多样化真实世界数据的重视。与以往仅靠模拟环境或有限场景采集相比,Project Go-Big 的数据极具代表性和丰富性,有望推动机器人真正 “走进” 普通家庭。机器人不再仅仅是工业流水线上的机械臂,而是能理解人类意图、适应现实环境的智能伙伴。
目前,Figure 正在持续扩大数据采集和模型训练的规模,力图让 Helix 能力更全面、适应更多场景。对于未来,这种 “人类行为到机器人能力” 无缝迁移的模式,或许会成为机器人领域的主流。它不仅降低了训练门槛,也让机器人与人类社会的融合变得更加自然和高效。随着数据和技术的不断进步,家庭场景下的机器人助手,可能会比我们想象得更早走进现实生活。
评论(0)