MIT 教授探索类人智能的奥秘

MIT副教授Phillip Isola通过心理物理学实验与视频预测等生成模型,探索人类如何直觉理解物理世界、推断物体功能并预测事件;其研究强调AI与人类认知的双向启发,旨在揭示智能本质的多样性。

发布于2025年11月11日 09:44
编辑零重力瓦力
评论0
阅读35

MIT 教授探索类人智能的奥秘

MIT 电气工程与计算机科学系副教授 Phillip Isola 致力于开发能够执行类人任务的模型,比如预测即将发生的事件,或想象物体被操作时的状态变化。

Isola 认为,通过研究这些模型的运作机理,研究人员能够更深入地理解人类的感知和认知能力。他表示,构建更优秀的智能系统模型,能够帮助我们更好地理解自身的智能。而对自身智能的深入理解,反过来又能促进更出色的人工智能系统的构建。这两者能够形成良性互动。

视觉感知的基础能力

Isola 的研究重点关注人类如何识别场景中的物体及其相互关系。他认为,这是最基础的视觉能力,一旦掌握了它,就能完成各种后续任务。

他的研究探讨了人类如何学会识别新物体,即便此前只见过寥寥几次。他还研究了 “功能性” 概念,即通过物体的外观推断其用途的能力。比如,即使从未见过某个特定的杯子,人们也能推断出可以用它来盛水。

为了研究这些现象,Isola 设计心理物理学实验来测试人类受试者,随后训练计算模型执行相同的任务。他说,思路是建立人类完成这些任务的模型,然后深入剖析模型内部,试图理解其工作机制,以此来推测人类可能采用的类似方式。

生成模型:预测未来的能力

目前,Isola 的实验室主要专注于 “生成模型” 研究——这类模型经过训练后能够生成新的数据,如图像或视频。DALL-E 就是这类模型的一个知名案例。

Isola 及其学生正在研究的视频预测模型能够预测视频接下来将会发生什么。这些模型在大量展示人与物体互动或物体之间相互作用的视频上进行训练。训练完成后,即使面对从未见过的类似场景,模型也能进行预测。

Isola 说,核心思想是,如果模型能够预测接下来会发生什么,那么它必然学习到了关于世界运作方式的某些知识。

这种预测未来的能力对机器人技术尤为重要,因为机器人需要能够预测在操纵物体或在环境中移动时会产生什么结果。Isola 认为,这类模型有助于揭示人类进行此类预测的机制。

他表示,人类在预测事物方面显然非常出色,我们时刻都在进行预测。当伸手去拿咖啡杯时,就会预测移动手臂会产生什么结果。研究团队希望更深入地理解这在人类大脑中是如何运作的,以及如何在机器中复现这种能力。

直觉物理学:无师自通的理解

Isola 的另一个研究方向是 “直觉物理学”,即人类理解物理世界运作规律的能力。即使没有接受过正式的物理学教育,人类也能很好地预测,比如从桌边推开一个杯子会发生什么。

他说,我们对物理学拥有良好的直觉,研究团队想要了解这种直觉的来源,以及如何在机器中复现它。

为了探索这一问题,Isola 和学生们正在训练模型来预测物理场景中会发生的情况,例如物体碰撞时的结果。他们还在研究这些模型如何能够从观察物体的图像或视频中学习,而不需要被明确告知支配物体行为的物理定律。

理解智能的多样性

除了开发新模型,Isola 还致力于更深入地理解现有模型的工作原理,包括研究这些模型学习到的表示方式,即它们用来编码世界信息的内部表征。

他说,我们想要了解这些模型在做什么,以及它们如何做到的。如果能够更好地理解它们,我们就能改进这些模型,同时也能更好地理解我们自身的智能。

Isola 对探索不同类型智能的细微差别充满兴趣,不仅包括人类智能,还有动物智能和人工智能。他认为,智能存在多种不同的类型,通过研究所有这些不同类型的智能,我们能够更好地理解智能的本质是什么,以及它可以呈现出哪些不同的形式。

参考链接

相关文章

Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?
AI 新闻资讯
2026年5月15日
0 条评论
小创

Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?

Anthropic 宣布作废未经董事会批准的二级市场员工股转让,导致其估值短期内大幅缩水,引发关于 AI 泡沫破裂的讨论。由于公司未上市,员工套现依赖私募渠道,中间商通过 SPV 层层转卖并收取高额手续费,造成交易混乱且投资者权益缺乏保障。Anthropic 明确不认可此类灰色渠道交易,使大量散户面临资金损失风险。此外,AI 巨头如 OpenAI、xAI 和 Anthropic 的股权高度集中,少数早期员工巨额套现加剧了财富分配不均。尽管行业技术飞速发展,但普通民众难以参与核心利益分配。

#Anthropic
阅读全文
Grok 4.3 被低估的隐藏工作流全解析
AI 新闻资讯
2026年5月13日
0 条评论
小创

Grok 4.3 被低估的隐藏工作流全解析

Grok 4.3 近期更新后,多数用户仍停留在简单问答模式。AI Master 的实操演示显示,这款工具的真正价值在于工作流整合:Fast/Auto/Expert 三档模式分工明确,Expert 模式下追加"什么条件变化会让你改变答案"可逼出明确结论而非模棱两可的套话。深度嵌入的搜索支持一键生成带引用的舆情分析,"反向观点扫描"能在信息茧房中找出盲区。任务功能可设定周期性指令自动运行,相当于零成本的专职信息助理;结构化输出配合内置 Python 执行,上传 CSV 直接出图表,省去本地配置环境的

#Grok#智能体工程
阅读全文
互动讨论

评论区

围绕《MIT 教授探索类人智能的奥秘》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。