AI 助手的新纪元:Manas AI 的崛起

Manus AI 是一款具备自主执行能力的通用智能体,在 GAIA Benchmark 中大幅超越 OpenAI Deep Research。它能端到端完成简历筛选、房产研究、股票分析等多步骤复杂任务,真正实现“从理解到行动”。今年将开源核心推理模型 Manus Reasoning,标志 AI 正从生成迈向执行新阶段。

发布于2025年3月6日 03:48
编辑零重力瓦力
评论0
阅读94

技术的革命往往在悄无声息中开始。当我们还沉浸在 DeepSeek 带来的狂欢中。另一家国内初创公司发布了他们的 "通用智能体" 产品:Manus,标志着我们与 AI 助理合作方式的重大转变。这款新的具有 “执行能力” 的智能体在 GAIA Benchmark(一项评估 AI 助手推理、多模态处理、网页浏览和工具使用等能力的基准测试) 中的表现远远优于 OpenAI 的 Deep Research!

Manus AI 的联合创始人、首席科学家 Peak 表示:"这不仅仅是另一个聊天机器人或工作流,而是一个真正自主的主体,能够弥合概念与执行之间的距离。" 这意味着新一代的 AI 助手不仅能够给我们带来想法,还能付诸行动。

Manus(名称源自拉丁文 Mens et Manus:"头脑与手")正好解决了这一痛点。它不仅能思考,还能行动。在展示的第一个例子中,Manas 轻松处理了简历筛选任务:解压文件,逐页浏览简历,记录关键信息,最后提供排名建议和候选人资料。更令人印象深刻的是,它能够根据反馈学习和调整,例如直接生成表格而非文本报告。

在纽约房产研究的例子中,Manus 展示了其真正的能力。它先制定计划,然后搜索安全社区信息,研究学校质量,编写预算计算程序,筛选房源,最后综合所有信息生成详细报告。这种多步骤、跨领域的解决问题能力令传统 AI 相形见绌。

技术专业人士可能会对第三个股票相关性分析的例子更感兴趣。Manus 通过 API 获取权威数据,验证数据质量,编写分析代码,创建可视化,甚至部署交互式网站并提供可分享链接。这种端到端的执行能力令人叹为观止。

Manus 是作为多智能体系统运行的,由几个不同的模型驱动。该公司承诺今年晚些时候开源部分模型,特别是 "Manus Reasoning"(推理模型),这显示了他们对开放协作的承诺。

在使用了各种 AI 工具后,我常常感到它们虽然“聪明”但缺乏执行力。它们可以告诉我应该做什么,但往往不能为我做事。Manus 或许能够填补了这一空白,它不仅理解需求,还能够自主行动并产出结果。

如果 Manus 能像展示的那样无缝运作,我们可能正站在 AI 发展的重要转折点上。这不再是关于更好的文本生和图像的生成,而是一个能够全方位执行各种任务的超级 AI 助理。当你可以委派研究、分析、编程任务给一个真正能够执行的 AI 助手时,你的工作效率会有多大提升。

当然,这种能力也带来了重要问题:如此强大的自主智能体会如何重塑就业市场?我们如何确保其决策过程透明且可控?这些都是我们在拥抱这种新技术时需要思考的问题。

无论如何,Manus 的出现标志着我们正从 AI 生成时代进入 AI 执行时代。正如 Peak 所说,这可能是 "AGI的初现端倪" !

Manus 使用地址:https://manus.im/

相关文章

GPT-5.6 Sol 来了:三模型家族、750 tokens/s、政府审查准入,OpenAI 这次改了游戏规则
AI 新闻资讯
2026年6月27日
0 条评论
零重力瓦力

GPT-5.6 Sol 来了:三模型家族、750 tokens/s、政府审查准入,OpenAI 这次改了游戏规则

OpenAI 发布 GPT‑5.6 系列,含 Sol、Terra、Luna 三档模型,定价分层明确。Sol 旗舰版支持 ultra 子智能体协作模式,编码能力刷新纪录,7 月将在 Cerebras 上实现 750 tokens/s 推理速度。该模型网络安全防御能力强于攻击,但 METR 评估显示其作弊率创历史新高。此外,GPT‑5.6 成为首个经美国政府事前准入审查的前沿模型,初期仅向受信任合作伙伴开放,并引入激活分类器等安全机制。

#ChatGPT#OpenAI
阅读全文
JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点
AI 编程开发
2026年6月19日
0 条评论
零重力瓦力

JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

#智能体#AI 编程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《AI 助手的新纪元:Manas AI 的崛起》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。