Meta 新型 AI 模型让扎克伯格坐上“主桌”

Meta 推出 Muse Spark 模型,这是其 AI 战略重启后的首款重要产品。 Muse Spark 具备多模态和高级推理能力,在基准测试中超越 OpenAI 、 Google 等竞争对手,被视为 Meta 迈向“个人超级智能”愿景的关键一步。为加速 AI 业务发展, Meta 投入巨资招聘顶尖人才和投资初创企业。当前模型保持闭源,但 Meta 承诺未来将开源,并发布安全扩展框架,阐述将 AI 能力扩展至超越人类水平的目标。

发布于2026年4月10日 18:33
编辑小创
评论0
阅读21

Meta 发布新 AI 模型 试图在 AI 领域占据更重要位置

Meta 于本周三发布了自去年在 CEO 马克·扎克伯格主导下重启 AI 战略以来的首款重要模型。这款名为 Muse Spark 的模型被视为迈向扎克伯格所提出的“个人超级智能”愿景的重要一步,不过目前该模型将保持闭源。

扎克伯格在一篇帖子中表示, Meta 的目标是打造能够“不仅回答问题,还能作为智能体为用户完成各项任务的 AI 产品”。这位亿万富翁还提到,他“对 AI 支持下的创造力、企业家精神、经济增长和健康领域的进步感到乐观”。

Muse Spark 看起来确实是 Meta 上一次重要发布 Llama 4 的重大升级。 Llama 4 于 2025 年 4 月发布,在科技行业被认为表现平平,令业界失望。

Meta 将通过 meta.ai 网站和 Meta AI 应用程序提供 Muse Spark 。与 Llama 系列不同, Muse Spark 不会开放给其他用户下载,不过公司表示希望在未来开源后续版本。 Meta 此前被视为开源 AI 领域的领导者,曾让研究人员、初创企业和爱好者下载并自定义 Llama 模型。

扎克伯格写道:“展望未来,我们计划发布越来越先进的模型,推动智能和能力边界的拓展,包括新的开源模型”。

Meta 自行发布的 Muse Spark 基准测试分数显示,该模型在某些任务上的表现优于 OpenAI 、 Anthropic 、 Google 和 xAI 的最新模型。 Meta 在一篇博客文章中表示,“Muse Spark 是我们 scaling ladder 的第一步”,指的是公司构建远超人类能力的 AI 的目标。

AI 基准测试公司 Artificial Analysis 提前获得了 Muse Spark 的访问权限,该公司在社交平台上表示,这款新模型是他们测试过的最优秀的模型之一。 Artificial Analysis 在帖子中写道:“Muse Spark 在 Artificial Analysis 智能指数中获得 52 分,位列我们基准测试过的前 5 名模型”,并引用了他们综合各项第三方基准测试的评分标准。

Meta 表示,新模型具备原生多模态能力,这意味着它经过训练可以处理图像、音频、视频以及文本。 Muse Spark 还具备高级推理能力,这是当前最优秀 AI 模型的关键特征。模型从零开始构建,旨在拥有强大的编程能力。 Meta 将这些特征描述为使用现代机器学习方法构建越来越强大模型的基础。

Meta 表示,他们构建 Muse Spark 是为了特别擅长提供医疗建议。 Meta 在博客文章中写道:“为了提升 Muse Spark 的健康推理能力,我们与超过 1000 名医生合作,整理训练数据,使模型能够提供更准确和全面的回答”。

自从 Llama 4 发布以来,扎克伯格投入了大量资金重塑 Meta 的人工智能业务。这家科技巨头从竞争对手那里挖来了顶尖 AI 工程师,相关薪酬方案价值数亿美元。公司还投入数十亿美元收购或投资了多家 AI 初创企业。 Meta 还招募了 AI 训练公司 Scale 的 CEO 亚历山大·王来领导 AI 业务,此前 Meta 已向该公司投资 143 亿美元。

Meta 还发布了一份文件,阐述了其安全地将 AI 模型扩展至超越人类水平性能愿景。公司发布的“高级 AI 扩展框架”详细说明了随着模型越来越先进将进行的安全检查。

Meta CEO马克·扎克伯格出席2025年10月29日在纽约举行的WSJ创新者奖颁奖典礼。

相关文章

Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
互动讨论

评论区

围绕《Meta 新型 AI 模型让扎克伯格坐上“主桌”》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。