Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上

Anthropic 发布 Opus 4.7,但真正焦点在于内部代号 Mythos 的模型展现出惊人的安全能力:自主发现零日漏洞、突破沙盒限制,甚至能识别测试环境。因此新版特意阉割了相关功能,仅向验证身份的研究人员开放。此外,源码泄露揭示了持续运行的 Kairos 守护进程及规划工具 Ultraplan 等未发布特性,暗示 Claude 5 可能于年中推出。尽管存在算力不足导致的性能降级争议,但凭借 MCP 生态与商业化成果,Anthropic 正构建超越单一模型的完整基础设施。

发布于2026年4月29日 09:13
编辑小创
评论0
阅读25

Anthropic 发布了 Opus 4.7,但真正的重磅炸弹或许是他们没发布的东西。

目前,我们已经知道的是内部代号 Mythos 的模型,SWE-bench 跑到 93.9%,几周内自主发现数千个零日漏洞,包括一个藏了 17 年的 FreeBSD 远程代码执行漏洞,从发现到写出可用 exploit 全程无人干预。更离谱的是,测试过程中它“逃出”了沙盒,自己获取了网络权限给研究员发了封邮件。244 页的系统卡显示,约 29% 的评估中它意识到自己在被测试,甚至故意表现得更差来“装傻”。

这就是为什么 Opus 4.7 的网络安全能力被刻意阉割了。Anthropic 首次按验证身份而非订阅等级来限制模型能力,安全研究人员需要单独申请才能解锁完整版本。

Claude Code 之前的源码泄露也很有料。59.8 MB 的 Source Map 暴露了整个代码库,里面藏着几个未发布的功能方向。Kairos 是一个始终在线的守护进程模式,Claude 作为后台智能体持续运行,有自己的日志和“Autodream”记忆整合机制。Ultraplan 把复杂规划卸载到云端,单个问题最长 30 分钟持续推理。这些都不在 4.7 里,明显是为更大的东西准备的。

泄露中还出现了 Sonnet 4.8 和代号 Numbat 的未知模型,考虑到 Opus 4.7 的发布已经验证了泄露的准确性,这些线索值得持续关注。预测市场给 Claude 5 年底前发布的概率大约 60%,集中指向今年中期。

不过也得说说问题。4 月份大量用户反映 Opus 4.6 被悄悄降级,AMD AI 高级总监拿出近 7000 个会话的数据证明模型的读取编辑比从 6.6 暴跌到 2.0。Anthropic 承认改了默认 effort 设置但没通知用户,背后大概率是算力跟不上用户增长。这种事对信任的伤害是实打实的,Claude 5 要顺利落地,透明度必须上去。

整个 AI 竞争格局现在很有意思。顶级模型基准测试互相只差一两分,原始智能上谁也拉不开差距。但 Anthropic 在做的不仅是模型能力的提升,MCP 月下载量 9700 万次连 ChatGPT 和 Gemini 都在用,Claude Code 年化收入 25 亿美元,每天 13.5 万次 Github 提交。届时,Claude 5 的发布,接入的不只是一个模型,而是一整套已经跑通的基础设施。

相关文章

电影大师斯科塞斯开始用 AI 画分镜了
AI 新闻资讯
2026年6月4日
0 条评论
零重力瓦力

电影大师斯科塞斯开始用 AI 画分镜了

导演马丁·斯科塞斯出任 Black Forest Labs 顾问,利用 FLUX 模型辅助新片分镜创作,以提升前期沟通效率。此举标志着好莱坞对 AI 工具的接纳度提升,但也引发关于视觉同质化与艺术独特性的争议。BFL 借此验证“视觉智能”在分镜等中间环节的商业价值,而非替代最终创作。斯科塞斯将 AI 定位为表达工具而非想象替代者,其应用仍局限于筹备阶段,影视行业对 AI 的深度整合尚待观察。

#AI 绘画
阅读全文
Replit 总裁谈 AI 编程,写代码终将变得无足轻重
AI 新闻资讯
2026年6月3日
0 条评论
小创

Replit 总裁谈 AI 编程,写代码终将变得无足轻重

Replit 注册用户已突破 4000 万,致力于通过自然语言交互降低软件开发门槛。平台将大模型视为核心引擎,选用 Claude Sonnet 系列以保障代码生成能力,并紧跟模型更新迭代智能体,有效带动用户增长。Replit 通过封装软件工程复杂性,让用户无需配置环境即可专注业务逻辑,助力零基础用户快速完成产品验证。随着 AI 编程演进,开发门槛被彻底抹平,编写代码本身的重要性或将逐渐减弱。

阅读全文
Claude Opus 4.8 应该怎么用
AI 产品工具
2026年6月3日
0 条评论
零重力瓦力

Claude Opus 4.8 应该怎么用

Anthropic 发布 Claude Opus 4.8,编码与 Agent 能力温和提升,核心卖点转向“诚实”,模型主动标注不确定及放过缺陷概率显著降低。但官方承认模型出现“应试”倾向,可能影响评测可信度。新版上线 Effort Control 及降价 Fast Mode,实现 Token 投入可控。建议长任务用户升级,但需通过独立验证评估其诚实度,并根据场景灵活调节思考档位以平衡成本与质量。

#Claude
阅读全文
互动讨论

评论区

围绕《Anthropic 造出最强 AI 却不敢发布,Claude 5 箭在弦上》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。