OpenAI 推出软件工程智能体:Codex

OpenAI 在 ChatGPT 中上线 Codex 研究预览版——一款基于云端、由全新 Codex-1 模型驱动的软件工程智能体。它可深度集成 GitHub 仓库,自动解析代码、发现并修复错误、提出优化建议,并完成从问题分析到测试验证的完整开发流程,支持多任务并行与沙盒化执行,现面向 Pro、企业及团队用户开放。

发布于2025年5月17日 04:37
编辑零重力瓦力
评论0
阅读17

OpenAI 今天再 ChatGPT 中推出了 Codex 研究预览版。新的 Codex 作为软件工程智能体意味着,AI 辅助编程从 "自动补全" 逐渐成为 "智能协作"。

Codex 的技术突破

Codex 是一个远程智能体软件系统,可以并行运行多种任务。与之前发布的本地运行的 Codex CLI 不同,新版 Codex 建立在 OpenAI 的云端计算资源之上,让用户能够启动多个智能体实例同时处理不同任务。系统由全新的 Codex-1 模型驱动,这是 OpenAI 迄今为止性能最优的编程模型,基于 o3 架构进行了专门优化。

该模型不仅关注基准测试成绩,更注重实际代码库整合的实用性,考虑了注释、变更合理性、代码风格等多方面因素。Codex 的一个显著特点是它可以与用户的 GitHub 代码仓库直接集成,读取并理解整个代码库,然后执行各种复杂任务。

工作原理与功能演示

在演示中,OpenAI 团队展示了 Codex 的几项核心能力:

  1. 代码解析与解释:Codex 能够阅读并向新手解释复杂代码库的结构和功能。
  2. 自动错误发现与修复:系统能够在代码库中检测并修复各类错误,包括类型错误、语法错误和逻辑缺陷。演示中,Codex 成功找出并修复了带有特殊字符的文件名导致的错误。
  3. 主动提出改进建议:Codex 不仅能够被动响应指令,还能主动分析代码库并提出优化建议,如修正可变对象作为默认参数、统一超时设置等。
  4. 完整工作流程:最令人印象深刻的是,Codex 能够完成从问题分析、代码编写到测试运行的完整流程。它会创建测试用例重现问题,编写解决方案,运行测试验证修复是否有效,最后提交完整的变更说明。

每个 Codex 任务都在独立的沙盒环境中运行,拥有自己的文件系统、CPU、内存和网络策略。系统使用的基础设施与 OpenAI 用于强化学习训练的系统相同,已经在大规模实战中经过验证。

实际应用体验

OpenAI 内部用户分享了使用 Codex 的经验,描述了如何将其融入日常工作流程。一个常见场景是,在处理其他任务时,用户可以花 30 秒向 Codex 提交代码变更请求,然后继续其他工作。稍后回来时,Codex 已经完成了任务,用户只需审核结果并决定是否采纳。

系统的透明性和可验证性是其关键优势。用户可以查看 Codex 做出的所有更改、参考的代码片段以及运行的测试结果,这使得代码审核变得直观高效。正如开发团队成员 Katy 所言:"Codex 和我们的同事一样值得信赖,甚至更值得,因为我能看到它的所有操作日志和测试输出。"

行业影响

OpenAI 认为,Codex 代表了软件工程未来的发展方向。随着开发人员更多地依赖 AI 协助,开发模式正在从"完全手动" 向 "人机协作" 转变。Codex 通过允许开发者告诉 AI "做什么 "而不是" 怎么做",释放了更多创造力。

未来,OpenAI 计划将 Codex 集成到更多系统中,如 Issue 追踪器、OpenAPI 规范和 CI/CD 流程。团队还设想了本地智能体与云端智能体的融合,一个既能查看本地代码又有独立计算能力的 "远程同事",可以无缝接管用户的工作。

Codex 现已向 ChatGPT Pro、企业和团队用户开放,后续将支持 Plus 和 Edu 用户。OpenAI 初期提供了慷慨的使用限额,不收取额外费用,但随着使用方式逐渐明确,可能会调整限额并考虑额外付费模式。

相关文章

氛围编程的下半场:你的 AI 编程 Agent 已经不需要你的电脑了
AI 编程开发
2026年5月17日
0 条评论
零重力瓦力

氛围编程的下半场:你的 AI 编程 Agent 已经不需要你的电脑了

氛围编程竞争焦点已从代码补全转向云端 Agent 独立完成工程任务。Cursor 推出 Cloud Agent 环境,支持多仓库挂载、环境配置即代码及严格的安全治理。开放 TypeScript SDK,使 Agent 可集成至 CI/CD 或内部产品,实现本地与云端部署对称。同时,Agent Harness 优化通过 Keep Rate 等指标提升模型表现。Mistral Vibe 和 Google Antigravity 亦印证此趋势:编程 Agent 脱离本地束缚,向自主执行、基础设施化演进。

#AI 编程#智能体工程
阅读全文
Hermes 超越 OpenClaw,背后是两种哲学的正面交锋
AI 产品工具
2026年5月16日
0 条评论
零重力瓦力

Hermes 超越 OpenClaw,背后是两种哲学的正面交锋

Hermes Agent 以单日 2240 亿 token 的处理量超越 OpenClaw,登顶开源 AI 智能体榜首。两者代表不同发展哲学:OpenClaw 侧重“连接一切”,拥有庞大生态但近期遭遇严重安全危机;Hermes 主打“自我进化”,通过自动反思生成技能并自主优化库,实现效率提升。尽管 OpenClaw 在广度上仍具优势,但 Hermes 凭借自学习机制和安全改进迅速崛起。未来趋势或指向两种哲学的融合,即兼具广泛连接与自主进化能力的智能体。

#Hermes Agent#OpenClaw#智能体框架
阅读全文
2026 国产大模型中文文案能力深度对比分析
AI 产品工具
2026年5月13日
0 条评论
零重力瓦力

2026 国产大模型中文文案能力深度对比分析

2026 年国产大模型中文文案能力迎来新标杆。评测显示,Kimi K2.6 以最低 "AI味” 和最高创意评分领跑,最接近人类写作风格。DeepSeek V4 Pro 凭借极低重复率和超长上下文,成为长文与 SEO 内容首选。GLM 5.1 则在指令遵循上表现最强,适合严格格式约束场景。文章详细对比了六款主流模型的规格、基准数据及适用场景,为品牌营销、内容创作团队提供选型参考。

#AI 模型#开源模型
阅读全文
互动讨论

评论区

围绕《OpenAI 推出软件工程智能体:Codex》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。