Agents SDK 迎来下一代智能体革新

OpenAI 发布 Agents SDK 重大更新,推出模型原生框架与沙箱执行能力。新框架内置 MCP 工具调用、 Skills 功能、 AGENTS.md 等实用原语,简化跨文件协调与长周期任务处理。通过内置沙箱支持与 Manifest 抽象层,实现本地到生产的无缝迁移,并保障凭证隔离与运行持久性。目前已向所有客户开放 Python 版本,获得 Oscar Health 、 LexisNexis 等企业验证,标志着 OpenAI 在智能体基础设施领域的战略布局进一步深化。

发布于2026年4月16日 14:33
编辑小创
评论0
阅读19

OpenAI 今日发布了 Agents SDK 的重大更新,为开发者提供了更强大的标准化基础设施,使其能够构建跨文件和工具工作的智能体,并在受控沙箱环境中处理长周期任务。

模型原生框架与沙箱执行

新版 Agents SDK 的核心升级在于引入了“模型原生框架”( model-native harness )。这一框架基于 OpenAI 模型的最优运行模式设计,使智能体能够更贴近模型本身的运作规律。实践中,这意味着复杂任务、尤其是需要跨多种工具和系统协调运行的长周期工作时,可靠性和性能都将得到显著提升。

框架现已内置多项实用原语:支持通过 MCP 进行工具调用、提供渐进式披露能力的 Skills 功能、可自定义指令的 AGENTS.md 文件、用于代码执行的 Shell 工具,以及用于文件编辑的 Apply Patch 工具。这套能力并非封闭系统,团队将持续引入新的智能体模式与原语,开发者因此可以将精力集中在让智能体产生实际价值的领域逻辑上,而非重复造轮子。

沙箱执行能力的整合是另一项关键更新。许多有实际价值的智能体需要读写文件、安装依赖、执行代码并安全调用工具,传统方案要求开发者自行拼凑这套执行环境。新版 SDK 通过内置的沙箱支持消除了这一门槛。目前已支持 Blaxel 、 Cloudflare 、 Daytona 、 E2B 、 Modal 、 Runloop 和 Vercel 等主流提供商。 SDK 还引入了 Manifest 抽象层,用于描述智能体的工作区配置,包括本地文件挂载、输出目录定义,以及与 AWS S3 、 Google Cloud Storage 、 Azure Blob Storage 和 Cloudflare R2 等存储服务的集成。

这一设计实现了从本地原型到生产部署的环境一致性迁移,同时为模型提供了一个可预期的工作空间:输入文件在哪里、输出结果写向何处、如何在长周期任务中保持工作有条不紊。

Diagram showing how the Agent SDK connects user input, models, and tools to build AI agents.

Diagram showing how to build AI agents using the Agent SDK with models, tools, and orchestration.

安全性、持久性与扩展性将框架层与计算层分离的设计决策在这套方案中扮演着核心角色。在模型生成的代码执行环境中,假设存在提示词注入和数据泄露威胁是审慎的安全假设。分离式架构可以将凭证隔离在代码执行环境之外,避免敏感信息暴露。这一架构还支撑了持久性执行能力。当智能体状态被外部化存储后,沙箱容器的丢失不会导致运行中断。 SDK 内置的快照与恢复机制允许在原有环境失败或过期时,在新容器中恢复智能体状态并从上一个检查点继续运行。在扩展性方面,智能体运行可以灵活配置:使用单个沙箱或多个沙箱、在需要时才调用沙箱、将子智能体路由至独立环境、在多个容器中并行化工作以加速执行。这些能力的组合使得整套方案能够适应从轻量原型到大规模生产部署的完整场景。企业验证与市场背景参与测试的企业已经验证了更新后的 SDK 在关键场景中的实际价值。 Oscar Health 的团队使用该 SDK 自动化了此前无法可靠处理的临床记录工作流。 Staff Engineer 兼 AI 技术负责人 Rachael Burns 表示,核心差异不仅在于提取正确的元数据,更在于能正确理解冗长复杂记录中每次就诊的边界。由此,团队能够更快把握每位患者在单次就诊中的情况,为会员提供更精准的照护需求支持和更优的服务体验。此外, LexisNexis 、 Thomson Reuters 、 Zoom 和 Tomoro AI 等企业也参与了测试。这一更新的实际背景在于:当前智能体开发领域存在明显的 tradeoff 。模型无关的框架虽然灵活,但无法充分利用前沿模型的能力;模型提供方的 SDK 更贴近模型运作,但框架层透明度不足;托管型智能体 API 简化了部署,却限制了智能体的运行位置及其对敏感数据的访问方式。新版 Agents SDK 试图在模型原生能力与开发者可见性之间找到更优的平衡点。

Logos for Daytona, E2B, Modal, Cloudflare, Vercel, Blaxel, Runloop

定价与可用性新版 Agents SDK 的能力现已向所有客户开放,通过 API 访问,计费采用标准 API 定价模式,基于 Token 用量和工具调用量计算。这些能力首发支持 Python , TypeScript 支持将在后续版本中推出。团队同时在推进代码模式( code mode )和子智能体( subagents )等高级能力的跨语言支持,并计划逐步扩大沙箱提供商的覆盖范围和集成生态。创艺洞察Agents SDK 的这次更新标志着 OpenAI 在智能体基础设施领域的战略意图进一步清晰。与其让开发者自行解决框架、沙箱、安全和扩展性等底层问题, OpenAI 选择将自身的工程能力封装为开箱即用的解决方案。对于企业而言,这一转变的价值在于降低了个性化基础设施的建设风险,同时保留了适配自身技术栈的灵活性。当框架层与计算层的分离成为行业实践的标准假设时,智能体系统的安全性和可靠性才能真正进入生产级讨论的范畴。

相关文章

Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
互动讨论

评论区

围绕《Agents SDK 迎来下一代智能体革新》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。