Agents SDK 迎来下一代智能体革新

OpenAI 发布 Agents SDK 重大更新,推出模型原生框架与沙箱执行能力。新框架内置 MCP 工具调用、 Skills 功能、 AGENTS.md 等实用原语,简化跨文件协调与长周期任务处理。通过内置沙箱支持与 Manifest 抽象层,实现本地到生产的无缝迁移,并保障凭证隔离与运行持久性。目前已向所有客户开放 Python 版本,获得 Oscar Health 、 LexisNexis 等企业验证,标志着 OpenAI 在智能体基础设施领域的战略布局进一步深化。

发布于2026年4月16日 14:33
编辑小创
评论0
阅读2

OpenAI 今日发布了 Agents SDK 的重大更新,为开发者提供了更强大的标准化基础设施,使其能够构建跨文件和工具工作的智能体,并在受控沙箱环境中处理长周期任务。

模型原生框架与沙箱执行

新版 Agents SDK 的核心升级在于引入了“模型原生框架”( model-native harness )。这一框架基于 OpenAI 模型的最优运行模式设计,使智能体能够更贴近模型本身的运作规律。实践中,这意味着复杂任务、尤其是需要跨多种工具和系统协调运行的长周期工作时,可靠性和性能都将得到显著提升。

框架现已内置多项实用原语:支持通过 MCP 进行工具调用、提供渐进式披露能力的 Skills 功能、可自定义指令的 AGENTS.md 文件、用于代码执行的 Shell 工具,以及用于文件编辑的 Apply Patch 工具。这套能力并非封闭系统,团队将持续引入新的智能体模式与原语,开发者因此可以将精力集中在让智能体产生实际价值的领域逻辑上,而非重复造轮子。

沙箱执行能力的整合是另一项关键更新。许多有实际价值的智能体需要读写文件、安装依赖、执行代码并安全调用工具,传统方案要求开发者自行拼凑这套执行环境。新版 SDK 通过内置的沙箱支持消除了这一门槛。目前已支持 Blaxel 、 Cloudflare 、 Daytona 、 E2B 、 Modal 、 Runloop 和 Vercel 等主流提供商。 SDK 还引入了 Manifest 抽象层,用于描述智能体的工作区配置,包括本地文件挂载、输出目录定义,以及与 AWS S3 、 Google Cloud Storage 、 Azure Blob Storage 和 Cloudflare R2 等存储服务的集成。

这一设计实现了从本地原型到生产部署的环境一致性迁移,同时为模型提供了一个可预期的工作空间:输入文件在哪里、输出结果写向何处、如何在长周期任务中保持工作有条不紊。

Diagram showing how the Agent SDK connects user input, models, and tools to build AI agents.

Diagram showing how to build AI agents using the Agent SDK with models, tools, and orchestration.

安全性、持久性与扩展性将框架层与计算层分离的设计决策在这套方案中扮演着核心角色。在模型生成的代码执行环境中,假设存在提示词注入和数据泄露威胁是审慎的安全假设。分离式架构可以将凭证隔离在代码执行环境之外,避免敏感信息暴露。这一架构还支撑了持久性执行能力。当智能体状态被外部化存储后,沙箱容器的丢失不会导致运行中断。 SDK 内置的快照与恢复机制允许在原有环境失败或过期时,在新容器中恢复智能体状态并从上一个检查点继续运行。在扩展性方面,智能体运行可以灵活配置:使用单个沙箱或多个沙箱、在需要时才调用沙箱、将子智能体路由至独立环境、在多个容器中并行化工作以加速执行。这些能力的组合使得整套方案能够适应从轻量原型到大规模生产部署的完整场景。企业验证与市场背景参与测试的企业已经验证了更新后的 SDK 在关键场景中的实际价值。 Oscar Health 的团队使用该 SDK 自动化了此前无法可靠处理的临床记录工作流。 Staff Engineer 兼 AI 技术负责人 Rachael Burns 表示,核心差异不仅在于提取正确的元数据,更在于能正确理解冗长复杂记录中每次就诊的边界。由此,团队能够更快把握每位患者在单次就诊中的情况,为会员提供更精准的照护需求支持和更优的服务体验。此外, LexisNexis 、 Thomson Reuters 、 Zoom 和 Tomoro AI 等企业也参与了测试。这一更新的实际背景在于:当前智能体开发领域存在明显的 tradeoff 。模型无关的框架虽然灵活,但无法充分利用前沿模型的能力;模型提供方的 SDK 更贴近模型运作,但框架层透明度不足;托管型智能体 API 简化了部署,却限制了智能体的运行位置及其对敏感数据的访问方式。新版 Agents SDK 试图在模型原生能力与开发者可见性之间找到更优的平衡点。

Logos for Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

定价与可用性新版 Agents SDK 的能力现已向所有客户开放,通过 API 访问,计费采用标准 API 定价模式,基于 Token 用量和工具调用量计算。这些能力首发支持 Python , TypeScript 支持将在后续版本中推出。团队同时在推进代码模式( code mode )和子智能体( subagents )等高级能力的跨语言支持,并计划逐步扩大沙箱提供商的覆盖范围和集成生态。创艺洞察Agents SDK 的这次更新标志着 OpenAI 在智能体基础设施领域的战略意图进一步清晰。与其让开发者自行解决框架、沙箱、安全和扩展性等底层问题, OpenAI 选择将自身的工程能力封装为开箱即用的解决方案。对于企业而言,这一转变的价值在于降低了个性化基础设施的建设风险,同时保留了适配自身技术栈的灵活性。当框架层与计算层的分离成为行业实践的标准假设时,智能体系统的安全性和可靠性才能真正进入生产级讨论的范畴。

相关文章

OpenAI 学院:提示工程基础
提示词工程
2026年4月16日
0 条评论
小创

OpenAI 学院:提示工程基础

提示词工程是设计和优化 AI 输入指令的核心技能,关键在于明确任务目标、提供背景信息并描述期望输出形式。随着指令精细化程度提升, AI 回答质量显著改善。面对复杂问题时采用分步提问、在具体性与简洁性间寻求平衡可获得更精准的回复。本质上这是一种精准表达的修炼,体现了与 AI 协作的迭代优化过程。

#OpenAI#提示词工程
阅读全文
Meta 与 Broadcom 联手开发定制 AI 芯片
AI 新闻资讯
2026年4月16日
0 条评论
小创

Meta 与 Broadcom 联手开发定制 AI 芯片

Meta 与 Broadcom 深化合作,共同开发多代 MTIA 定制芯片,首阶段部署规模将突破 1 吉瓦,以支撑其 AI 产品与服务。 MTIA 定位内部推理与推荐任务加速, Meta 已在数据中心部署数十万颗该芯片。此番合作意味着 Meta 试图掌控从加速器到网络互联的完整底层栈,其“外部采购+内部定制”的双轨模式正在成为大型科技公司标配。

#Meta
阅读全文
OpenAI 扩大 GPT-5.4-Cyber 可信访问权限
AI 新闻资讯
2026年4月16日
0 条评论
小创

OpenAI 扩大 GPT-5.4-Cyber 可信访问权限

OpenAI 将可信访问网络安全计划大规模扩展,向数千名防御者开放专用模型 GPT-5.4-Cyber 。该模型专为防御性网络安全任务设计,可在缺少源代码的情况下进行二进制逆向工程,检测恶意代码和漏洞。同期推出的 Codex Security 安全智能体已在测试中扫描超过 120 万次代码提交,识别大量安全问题。 OpenAI 强调分级访问机制,目标是安全研究人员、防御工程团队等专业人士,并将安全能力与责任机制同步扩展作为核心理念。

#OpenAI#AI 安全
阅读全文
互动讨论

评论区

围绕《Agents SDK 迎来下一代智能体革新》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。