Anthropic 联手竞争对手,共同防止 AI 攻击一切
这项名为 Project Glasswing 的计划汇集了 Apple 、 Google 以及 45 家其他组织。他们将利用全新的 Claude Mythos Preview 模型来推动 AI 网络安全能力的发展。

三月底泄露的消息透露 Anthropic 开发了一款强大的新型 Claude 模型后,该公司于本周二正式发布了 Mythos Preview ,同时宣布了一个名为 Project Glasswing 的行业联盟,旨在应对新模型带来的网络安全影响,以及 AI 领域能力快速进步所产生的更广泛问题。
该联盟成员包括 Microsoft 、 Apple 、 Google 、亚马逊云服务、 Linux 基金会、 Cisco 、 Nvidia 、 Broadcom 以及 40 多家科技、网络安全、关键基础设施和金融机构。这些组织将获得模型的私密访问权限,该模型目前尚未公开发布。此举的部分目的是让全球基础技术平台的开发者有时间在自家系统上测试 Mythos Preview ,从而识别并修复模型在模拟攻击中发现的漏洞和攻击链。更重要的是, Anthropic 强调,组建这个联盟的目的是推动整个行业紧急探索 AI 能力正如何接近颠覆全球现有软件安全及数字防御实践的临界点。
公司前沿红队负责人 Logan Graham 对知名科技媒体 WIRED 表示:“真正的信息是,这不是关于这个模型或 Anthropic 本身。我们需要现在就为一个这些能力在 6 个月、 12 个月、 24 个月后将被广泛使用的世界做好准备。很多安全方面的假设可能会改变,我们建立现代安全范式基础的那些前提假设可能会崩溃。”
由多家公司开发和训练的模型正日益具备发现代码漏洞、提出修复建议或攻击策略的能力。这创造了新一代安全领域经典攻防博弈的局面: AI 工具既可以助益于防御方,也可能被恶意行为者利用,使那些曾经因成本过高或过于复杂而不可行的攻击变得容易实现。
Anthropic 首席执行官 Dario Amodei 在 Project Glasswing 发布视频中表示:“Claude Mythos Preview 是一次特别大的跨越。我们并没有专门训练它擅长网络安全。我们训练它擅长代码,但作为擅长代码的副作用,它同时也擅长网络安全。”他在视频中补充道:“更强大的模型会来自我们,也会来自其他公司。所以我们确实需要一个应对计划。”
Graham 指出,除了发现漏洞——包括生成潜在攻击链和概念验证——Mythos Preview 还具备更高级的漏洞利用开发、渗透测试、端点安全评估、搜索系统错误配置以及在没有源代码的情况下评估软件二进制文件的能力。
Graham 表示, Anthropic 采用分阶段的方式发布 Mythos Preview ,从行业协作阶段开始,这一做法借鉴了协调漏洞披露的原则,即在漏洞公开讨论前给开发者留出时间进行修复。
Graham 说:“我们已经看到 Mythos Preview 能够完成高级安全研究员才能完成的工作。这对于此类能力应该如何发布有着非常重大的影响。如果处理不当,这可能会成为攻击者的显著加速器。”
Project Glasswing 的合作伙伴,包括 Anthropic 的一些竞争对手,在发布声明中表达了合作的态度。
Google 安全工程副总裁 Heather Adkins 在声明中表示:“Google 很高兴看到这一跨行业网络安全倡议汇集在一起。我们一直认为 AI 在网络防御领域既带来新的挑战,也带来新的机遇。”
互联网基础设施的维护者以及基础技术平台的开发者似乎也对这种合作充满热情,尤其是考虑到 Anthropic 表示 Mythos Preview 的使用已经帮助发现了数千个关键漏洞,其中包括一些数十年历史的漏洞,这些漏洞即使在最严格的代码审查中也被反复遗漏或忽视。
Microsoft 全球首席信息安全官 Igor Tsyganskiy 在声明中表示:“当我们进入网络安全不再受纯人类能力限制的阶段时,负责任地使用 AI 来大规模提升安全、降低风险的机会是前所未有的。加入 Project Glasswing 并访问 Claude Mythos Preview ,使我们能够在早期识别和缓解风险,增强我们的安全和开发解决方案,从而更好地保护客户和 Microsoft 。”
Graham 表示, Anthropic 团队作为前沿研究小组,感受到了紧迫性和全球协作的必要性。
Graham 说:“这个联盟最需要做的事情可能是找出所有需要答案的问题,然后找到答案。 Project Glasswing 只是一个起点。如果只是少数几家公司使用一个模型,它就会失败。它必须发展成更大型的组织。”
这篇文章反映了一个值得关注的现象: AI 在网络安全领域的双刃剑效应日益明显。 Mythos Preview 模型展示的能力既是防御工具,也可能成为攻击手段。 Project Glasswing 的成立某种程度上代表了一种行业共识的转变,即在 AI 能力指数级增长的压力下,单打独斗已经不够,整个生态系统的协同防御成为必然选择。这种“先保护好自己人”的策略是否能有效遏制恶意使用,还有待观察。


