OpenAI 发布 Codex 重大更新:智能体可操控计算机、覆盖软件开发全流程
2026 年 4 月 16 日, OpenAI 正式发布 Codex 重大版本升级。这套系统如今已成为超过 300 万开发者的日常工作伙伴,这些开发者每周都在借助 Codex 加速软件开发的各个环节。
新版 Codex 实现了多项关键突破。系统现在能够代替用户操控计算机,通过屏幕识别、鼠标点击和键盘输入完成各类操作。多个智能体可以在同一台 Mac 上并行运行,彼此之间互不干扰。此外, Codex 还集成了图像生成能力,可以记住用户偏好并从过往操作中持续学习,甚至能够承担周期性的重复工作任务。
在开发者工作流方面, Codex 带来了显著提升。系统现在支持处理 GitHub 代码评审评论、运行多个终端标签页、通过 SSH 连接远程开发环境。在应用内置浏览器中,用户可以直接在页面上添加评论,为智能体提供精确的操作指令。开发者还可以直接在侧边栏打开文件并预览 PDF 、电子表格、幻灯片和文档。
OpenAI 同时发布了超过 90 个新增插件,这些插件整合了各类技能、应用集成和 MCP 服务器,为 Codex 提供了更丰富的上下文获取和行动途径。其中对开发者最具实用价值的包括 Atlassian Rovo (用于管理 JIRA 、 CircleCI 、 CodeRabbit 、 GitLab Issues )、 Microsoft 办公套件、 Neon by Databricks 、 Remotion 、 Render 和 Superpowers 等。
新版 Codex 还强化了自动化能力。用户现在可以复用既有对话线程,保持之前建立的上下文不被中断。系统能够为自己安排未来任务并在指定时间自动唤醒,持续推进可能跨越数天甚至数周的长期工作。团队用户借助自动化功能处理各种事务,从处理待合并的 Pull Request 到跟进任务进度,再到监控 Slack 、 Gmail 和 Notion 等工具中的动态对话。
记忆功能也进入预览阶段。该功能允许 Codex 记住从过往经验中积累的有用上下文,包括个人偏好、纠正信息和需要时间收集的资料。这项能力让后续任务的完成速度大幅提升,质量也更接近过去只有通过大量定制指令才能达到的水平。
Codex 现在还能主动向用户推荐值得继续的工作。基于项目上下文、已连接插件和记忆数据,系统可以建议如何开始一天的工作或从何处继续之前的项目。例如, Codex 能够识别 Google 文档中待处理的相关评论,从 Slack 、 Notion 和代码库中提取背景信息,然后为用户提供一份优先级排列的行动清单。
这些更新即日起向已登录 ChatGPT 的 Codex 桌面应用用户推送。个性化功能(包括上下文感知建议和记忆)将陆续向 Enterprise 、 Edu 以及欧盟和英国用户开放。计算机后台操控功能目前仅支持 macOS ,欧盟和英国用户的访问权限也将很快解锁。
回顾 Codex 发布至今这一年来的发展轨迹,开发者对这套工具的使用方式已发生显著变化。用户最初接触 Codex 是为了编写代码,随后逐渐将其扩展到理解系统架构、收集背景资料、评审工作成果、调试问题、协调团队合作以及维持长期工作的推进等更广泛的场景。
OpenAI 的使命是确保通用人工智能惠及全人类,这其中自然包括缩小人们想象力与实际构建能力之间的差距。此次发布的更新让 Codex 更加深入地融入软件构建所涉及的工具、工作流和决策环节,更多能力已在规划之中。
创艺洞察
Codex 此次升级的意义远不止功能堆叠。当一个 AI 编程助手能够直接操控计算机、记住用户习惯、主动建议工作优先级时,它正在从“辅助工具”向“数字同事”的角色过渡。这种转变将重新定义开发者的工作边界,人类负责决策与创意,机器承担执行与跟进。值得关注的是,这种深度融入也意味着用户对系统的依赖会加速形成,未来如何保持人类在关键环节的主导权,将成为技术团队和终端用户都需要提前思考的命题。


