
OpenAI 今天再 ChatGPT 中推出了 Codex 研究预览版。新的 Codex 作为软件工程智能体意味着,AI 辅助编程从 "自动补全" 逐渐成为 "智能协作"。
Codex 的技术突破
Codex 是一个远程智能体软件系统,可以并行运行多种任务。与之前发布的本地运行的 Codex CLI 不同,新版 Codex 建立在 OpenAI 的云端计算资源之上,让用户能够启动多个智能体实例同时处理不同任务。系统由全新的 Codex-1 模型驱动,这是 OpenAI 迄今为止性能最优的编程模型,基于 o3 架构进行了专门优化。
该模型不仅关注基准测试成绩,更注重实际代码库整合的实用性,考虑了注释、变更合理性、代码风格等多方面因素。Codex 的一个显著特点是它可以与用户的 GitHub 代码仓库直接集成,读取并理解整个代码库,然后执行各种复杂任务。
工作原理与功能演示
在演示中,OpenAI 团队展示了 Codex 的几项核心能力:
- 代码解析与解释:Codex 能够阅读并向新手解释复杂代码库的结构和功能。
- 自动错误发现与修复:系统能够在代码库中检测并修复各类错误,包括类型错误、语法错误和逻辑缺陷。演示中,Codex 成功找出并修复了带有特殊字符的文件名导致的错误。
- 主动提出改进建议:Codex 不仅能够被动响应指令,还能主动分析代码库并提出优化建议,如修正可变对象作为默认参数、统一超时设置等。
- 完整工作流程:最令人印象深刻的是,Codex 能够完成从问题分析、代码编写到测试运行的完整流程。它会创建测试用例重现问题,编写解决方案,运行测试验证修复是否有效,最后提交完整的变更说明。
每个 Codex 任务都在独立的沙盒环境中运行,拥有自己的文件系统、CPU、内存和网络策略。系统使用的基础设施与 OpenAI 用于强化学习训练的系统相同,已经在大规模实战中经过验证。
实际应用体验
OpenAI 内部用户分享了使用 Codex 的经验,描述了如何将其融入日常工作流程。一个常见场景是,在处理其他任务时,用户可以花 30 秒向 Codex 提交代码变更请求,然后继续其他工作。稍后回来时,Codex 已经完成了任务,用户只需审核结果并决定是否采纳。
系统的透明性和可验证性是其关键优势。用户可以查看 Codex 做出的所有更改、参考的代码片段以及运行的测试结果,这使得代码审核变得直观高效。正如开发团队成员 Katy 所言:"Codex 和我们的同事一样值得信赖,甚至更值得,因为我能看到它的所有操作日志和测试输出。"
行业影响
OpenAI 认为,Codex 代表了软件工程未来的发展方向。随着开发人员更多地依赖 AI 协助,开发模式正在从"完全手动" 向 "人机协作" 转变。Codex 通过允许开发者告诉 AI "做什么 "而不是" 怎么做",释放了更多创造力。
未来,OpenAI 计划将 Codex 集成到更多系统中,如 Issue 追踪器、OpenAPI 规范和 CI/CD 流程。团队还设想了本地智能体与云端智能体的融合,一个既能查看本地代码又有独立计算能力的 "远程同事",可以无缝接管用户的工作。
Codex 现已向 ChatGPT Pro、企业和团队用户开放,后续将支持 Plus 和 Edu 用户。OpenAI 初期提供了慷慨的使用限额,不收取额外费用,但随着使用方式逐渐明确,可能会调整限额并考虑额外付费模式。
评论(0)