生成式 AI 的未来将会怎样?

2025 年 9 月 MIT 举办首届生成式智能体影响联盟峰会,业界领袖共论技术未来。 MIT 校长与教务长强调需确保人类智慧与技术同步进步。杨立昆指出生成式智能体真正的突破口在于研发“世界模型”,即让机器像婴儿般通过感官与物理世界互动来构建对现实的抽象理解。亚马逊 CTO 认为生成式智能体是极具影响力的技术。峰会折射出业界期待正从“更强大的语言能力”转向“更接近人类认知模式的学习机制”。

发布于2026年4月13日 10:22
编辑小创
评论0
阅读26

麻省理工首届生成式智能体影响联盟峰会召开,业界领袖共论技术未来走向

2025 年 9 月 17 日,数百名研究人员、企业领袖、教育工作者和学生齐聚麻省理工学院克雷斯基礼堂,出席首届 MIT 生成式智能体影响联盟( MGAIC )峰会。峰会上,各方围绕生成式智能体技术的潜力与挑战展开讨论,勾勒出这一领域即将迎来的变革图景。

MIT 教务长阿南塔·钱德拉卡桑在开幕致辞中直言,当前正处于关键节点:“生成式智能体技术正在飞速演进。我们需要确保,随着技术不断进步,人类整体的智慧也能同步跟上。”MIT 校长萨莉·科恩布鲁特进一步指出,面对技术狂飙突进带来的复杂局面, MIT 有责任推动这些进步持续服务于全人类。“我们如何才能驾驭生成式智能体的魔力,让它在现实世界的关键应用中值得信赖?”她向与会者抛出了这一核心命题。

MGAIC 于今年 2 月正式启动,是一个汇聚行业领袖与 MIT 研究人员的协作平台,旨在驾驭生成式智能体技术造福社会。当天的峰会正是在这一框架下举办的首次大型活动。

Meta 首席智能体科学家杨立昆以主题演讲嘉宾身份亮相。他抛出了一个与当前主流认知相异的判断:生成式智能体领域最激动人心的突破,可能不会来自对大语言模型如 Llama 、 GPT 、 Claude 的持续优化与扩展。这位图灵奖得主认为,通过海量数据训练,这些庞大的生成模型不过是学会了识别模式并产出新内容,真正的突破口在于另一条路径。

杨立昆及其团队正在推进“世界模型”的研发。这套系统的学习方式与婴儿如出一辙:通过视觉和与周围环境的感官互动来认知世界。“一个 4 岁孩子通过视觉接收的数据量,与最大的语言模型相当。世界模型将成为未来智能体系统的关键组成部分。”在他描绘的愿景中,装载了世界模型的机器人将能够自主学习完成全新任务,无需任何专门训练。这正是他眼中企业让机器人在现实世界中真正发挥作用的最优路径。

至于外界对人工智能失控的忧虑,杨立昆显得颇为从容。他承认工程师必须为未来的智能体系统设计防护机制,但同时指出,人类社会数千年来一直在通过制定规则来约束自身行为,使其与公共利益保持一致。“我们确实需要设计防护机制,但可以确保的是,这些系统从构造上就无法挣脱这些约束。”他说。

亚马逊机器人首席技术官泰·布雷迪同样聚焦于生成式智能体对机器人产业的深远影响。这位在机器人领域深耕多年的技术领袖毫不掩饰自己的判断:“生成式智能体大概是我整个职业生涯中见证过的最具影响力的技术。”他透露,亚马逊已在大量仓库中部署生成式智能体技术,优化机器人搬运物料的路径规划,从而提升订单处理效率。他预判,未来更多创新将集中于协作机器人领域——构建能够与人类高效配合的机器系统。

除两场主题演讲外,来自可口可乐、亚德诺半导体以及医疗智能体创业公司 Abridge 等企业的代表也分享了生成式智能体在各行业的应用实践。 MIT 多位教职人员则介绍了各自团队的前沿研究,涵盖利用智能体降低生态图像数据噪声、设计能够抑制偏见与幻觉的新型智能体系统,以及让大语言模型更好地理解视觉世界等课题。

峰会收官之际, MIT MGAIC 教职人员联合负责人、 Vivek Farias 教授向与会者留下了一句期许:“希望各位带着一种可能性感知离开,同时怀揣将这种可能性变为现实的紧迫感。”

创艺洞察

首届 MGAIC 峰会折射出一个正在发生微妙转变的信号:业界对生成式智能体的期待,正从“更强大的语言能力”悄然移向“更接近人类认知模式的学习机制”。杨立昆关于世界模型的论述看似标新立异,实则呼应了一个深层问题——当前大语言模型的 Scaling Law 或许正逼近瓶颈,而让机器像婴儿般通过感官与物理世界互动来构建对现实的抽象理解,正在成为下一阶段竞争的隐秘赛道。对于中国科技界而言,这一动向值得深思:我们在算力与数据规模上的追赶固然重要,但在认知架构层面的原创性探索,或许才是决定能否真正站上潮头的关键变量。

相关文章

Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
互动讨论

评论区

围绕《生成式 AI 的未来将会怎样?》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。