Anthropic 正式发布了目前最强大的模型 Claude Fable 5 并且向公众开放。这款被称为神话级的模型在发布前经历了一段曲折。此前由于预览版模型(Mythos)能轻易找出数千个网络安全漏洞,出于安全隐患,没有直接公开,转而将其提供给安全防御人员。为了让大家都能用上这款顶级模型,开发团队设计了一套很有意思的安全路由机制。当用户提交涉及网络安全或生物学等高风险领域的请求时,系统会自动将请求重定向到较温和的 Opus 4.8 处理。这种分流设计在保障安全底线的同时,最大化释放了 Fable 5 的通用能力。在实际应用中,这款模型最强的地方在于超高的自主性。它不仅能写代码,还能处理金融、法律、科学研究等领域的复杂项目,甚至可以连续自主运行数天而不需要人工干预。这种长周期、高自主性的任务处理能力,可能会彻底改变我们日常的工作流。
相关文章
AI 产品工具
2026年6月13日
0 条评论
小创
电脑自己动起来了?Windows 版 Codex 迎来功能更新
Windows 版 Codex 新增计算机操控与移动端访问功能。AI 可直接接管电脑屏幕和光标,自动操作桌面软件及浏览器多标签页任务,简化繁琐工作流程。用户只需在设置中开启相关选项并添加设备即可使用。同时,该更新打通手机端,支持通过 iOS 或 Android 端 ChatGPT 应用扫码绑定,实现远程查看任务进度及发起新的电脑操控指令,大幅提升跨设备协作效率与自动化体验。
#Codex#智能体
阅读全文
AI 产品工具
2026年6月13日
0 条评论
小创
DeepSWE 新基准测试为什么会爆火
新基准测试 DeepSWE 因杜绝数据污染且贴近真实开发场景而受关注。该测试采用全手写未公开任务,提示词简短但代码量大,有效检验模型自主理解与编码能力。测评显示 GPT 5.5 以 70% 得分领先,Opus 4.7 落后超 15 分且成本高出近三倍。测试还揭示了模型行为差异:Claude 易遗漏需求并检索历史答案,GPT 5.5 则严格遵循指令。DeepSWE 被认为更能反映大模型实际编程水平。
阅读全文
AI 产品工具
2026年6月13日
0 条评论
小创
Claude Fable 5 实测
Claude Fable 5 发布,定位为 Mythos 降权公开版,核心优势在于长程复杂任务的稳定性。该模型支持 1M token 上下文,在 Stripe 全库迁移等场景中表现优异。安全方面采用运行时分流机制,高风险请求自动路由至 Opus 4.8。定价为输入 $10/百万 token、输出 $50/百万 token,6 月 22 日前对订阅用户免费,并已上线 AWS Bedrock 和 GitHub Copilot。实测显示其代码生成与 3D 建模能力显著优于前代,建议针对长任务场景进行实
#AI 模型#Claude Fable 5
阅读全文
互动讨论
评论区
围绕《能自主运行数天的神话级模型 Claude Fable 5 正式发布》展开交流,未登录用户可浏览评论,登录后可参与讨论。
评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
暂无评论,欢迎成为第一个参与讨论的人。