继 Anthropic 的 Mythos 之后, OpenAI 推出新型网络安全模型与战略

OpenAI 发布专用网络安全模型 GPT-5.4-Cyber ,采用克制态度强调现有安全防护已足够。该公司提出三大战略支柱:客户验证系统、迭代部署和投资布局。同时 Anthropic 持不同观点,认为更先进 AI 模型存在被恶意利用风险,引发安全专家争议。

发布于2026年4月15日 13:30
编辑小创
评论0
阅读0

OpenAI 发布专用网络安全模型 强调现有防护措施已足够

OpenAI 于本周二公布了其网络安全战略的下一阶段规划,并同步推出了一款专为数字防御者设计的全新模型 GPT-5.4-Cyber 。

这一消息发布恰逢竞争对手 Anthropic 上周宣布将其 Claude Mythos Preview 模型暂不公开。据 Anthropic 方面表示,该模型存在被黑客和不法分子利用的风险。与此同时, Anthropic 还牵头成立了一个涵盖 Google 等行业竞争者的产业联盟,旨在探讨生成式 AI 领域的进展将对网络安全产生何种影响。

面对 Anthropic 的高调预警, OpenAI 显然有意在周二传递出截然不同的信息基调。这家 AI 巨头采用了更为克制的语气,一边强调其现有的安全护栏和防御机制,一边暗示长期来看的确需要更先进的防护手段。

OpenAI 在当天发布的博客文章中写道:“我们认为,当前所使用的安全防护级别已足以显著降低网络风险,支持现有模型的大规模部署。我们预计,这些防护措施的基本框架将同样适用于即将推出的更强能力模型。不过,对于那些专门针对网络安全工作进行训练并被设置为更高开放程度的模型,则需要更严格的部署控制和相应的管理机制。从长远来看,为确保 AI 安全在网络安全领域的持续有效性,我们还预见到未来模型需要更加全面的防御手段——届时这些模型的能力将快速超越当前最好的专用模型。”

围绕网络安全战略, OpenAI 将重心锁定在三大支柱上。第一支柱涉及所谓的“了解你的客户”验证系统,旨在实现对新型模型的可控访问,同时尽可能扩大其“民主化”覆盖范围。 OpenAI 在博客中表示:“我们设计的机制旨在避免武断地决定谁能获得访问权限用于合法目的,谁不能。”该公司将针对特定组织进行有限发布与今年 2 月推出的自动化系统 Trusted Access for Cyber (简称 TAC )相结合。

第二支柱是“迭代部署”,即通过审慎的方式逐步释放新能力,让公司获得真实世界的反馈与洞察。博客特别强调了“对越狱攻击和其他对抗性攻击的抵御能力”以及“提升防御能力”两个重点方向。第三支柱则是投资布局,该公司表示这些投资将支持软件安全及其他数字防御领域,随着生成式 AI 的普及而持续发挥作用。

OpenAI 表示,这一系列举措是其更广泛安全努力的一部分。上个月启动的应用安全 AI 智能体 Codex Security 、 2023 年启动的网络安全资助计划、向 Linux Foundation 捐款支持开源安全项目,以及用于评估和防御前沿 AI 能力“严重伤害”的“准备框架”,均被纳入这一整体框架。

Anthropic 上周关于更强 AI 模型必将引发网络安全清算的主张,在安全专家群体中引发了争议。部分声音认为这一担忧言过其实,可能助长新一轮反黑客情绪,进一步巩固科技巨头的权力。另一些专家则强调,当前安全防御中已知的漏洞和不足确实存在,在智能体 AI 时代完全可能被更广泛的恶意行为者以全新速度和强度加以利用。

相关文章

自动化对齐研究:如何用大语言模型规模化可扩展监督
AI 新闻资讯
2026年4月15日
0 条评论
小创

自动化对齐研究:如何用大语言模型规模化可扩展监督

Anthropic 最新研究显示,配置后的 Claude 模型在 AI 对齐研究上展现惊人能力。 9 个 AAR 智能体仅用 5 天便将关键指标从 23%提升至 97%,并具备跨领域泛化能力。但该方法存在明显局限:跨规模迁移未达统计显著、存在领域依赖特征。更值得关注的是,研究揭示了“奖励黑客”风险及“外星科学”隐患——AI 推理可能逐渐超出人类理解能力,凸显人类监督的必要性。

#Anthropic#AI 安全
阅读全文
Gemini Robotics-ER 1.6 :通过增强具身推理赋能现实世界机器人任务
AI 新闻资讯
2026年4月15日
0 条评论
小创

Gemini Robotics-ER 1.6 :通过增强具身推理赋能现实世界机器人任务

Google DeepMind 正式推出 Gemini Robotics 系列模型,标志着这家科技巨头在具身智能领域迈出关键一步。该模型延续 Gemini 家族在多模态理解和推理方面的优势,旨在解决具身智能的两大瓶颈:复杂环境泛化能力和长周期任务连贯性。 Google 意在抢占行业标准制定者位置,其优势在于成熟的多模态研发体系、充足算力及 Android 生态的边缘部署经验。真正的悬念在于开发者社区能否基于此模型推出超越实验室 demo 的实用应用。

#具身智能#Google#Gemini
阅读全文
一文了解 Google Chrome 的 AI 驱动‘Skills’功能
AI 新闻资讯
2026年4月15日
0 条评论
小创

一文了解 Google Chrome 的 AI 驱动‘Skills’功能

Google Chrome 推出“Skills”功能,提供 50 余个 AI 指令模板,支持视频总结、食谱优化等场景,并通过快捷键实现可重复执行。该功能标志着浏览器从问答工具向“操作型代理”转型,降低用户操作成本,提升工作流效率。用户亦可基于 Gemini 创建自定义 Skills ,形成个性化 AI 工作流。

#Google#Gemini#提示词工程
阅读全文
互动讨论

评论区

围绕《继 Anthropic 的 Mythos 之后, OpenAI 推出新型网络安全模型与战略》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。