OpenAI Codex 升级为全能桌面工作台:编程助手到生产操作系统的跨越
OpenAI 于本周三正式将 Codex 从云端编程智能体扩展为支持 macOS 计算机控制的桌面工作中心。新版本实现了多个行业首次,包括让多个智能体在后台并行操作桌面应用程序、拥有独立光标的可视化控制,以及通过 GPT-image-1.5 模型直接生成图像。这些能力意味着开发者可以在不离开 Codex 的情况下完成从编码、测试、浏览器调试到视觉资产生成的完整工作流。
核心功能全面升级
Codex 的此次迭代在多个维度实现了突破。在操作系统层面,新增的背景计算机使用功能允许智能体用自己的光标在 Mac 上观察界面、执行点击和文字输入,用户可以在同一时间继续处理其他任务。内置浏览器现在支持开发者直接在页面元素上添加评论,特别适合前端迭代、应用程序和游戏开发场景。图像生成功能整合了 GPT-image-1.5 模型,可以根据自然语言描述快速产出设计素材。
在生态扩展方面,超过 90 个新插件现已上架,支持的第三方工具链显著丰富。多终端标签页让并行处理多个命令行任务成为可能, SSH 访问通道可以直接连接远程开发环境。更丰富的文件预览功能改进了一站式查看代码、日志和产物的体验,新增的摘要面板则聚合了计划信息、数据来源和生成内容的统一视图。
技术架构层面, OpenAI 已经将 GPT-5.4 确立为 Codex 的推荐模型。这被公司描述为 Codex 中首个具备原生计算机使用能力的多用途模型,同时带来了实验性的 100 万 Token 上下文窗口支持。
定位转向:从编程助手到工作操作系统
这次更新的战略意义在于定位的根本转变。 2025 年首次亮相时, Codex 被定位为云端软件工程智能体,在沙盒环境中并行处理与代码仓库相关的任务。今年 2 月推出的 Codex 应用将其升级为桌面命令中心,整合了并行智能体、工作树、内置 Git 工具、自动化脚本和长时运行线程。此次迭代则将这个桌面工具进一步推向全能工作层。
OpenAI 在公告中披露了最新的用户规模数据。目前每周有超过 300 万开发者在使用 Codex ,另一份发布于 4 月的报告则独立确认了 200 万周活用户数。关键的增长指标来自企业市场:自今年 1 月以来, ChatGPT Business 和 Enterprise 产品中的 Codex 使用量增长了 6 倍。
商业化布局同步推进。 Codex 现已包含在所有 ChatGPT 订阅计划中,同时针对 Business 和 Enterprise 客户推出了独立的按量付费席位。这些调整表明 OpenAI 的意图并非让 Codex 停留在终端内的辅助工具角色,而是要将其打造为软件开发者日常的工作操作界面。
功能上线的节奏存在明显的分阶段特征。计算机控制功能目前仅面向 macOS 用户开放,而个性化和记忆功能、企业和教育版本的多语言支持仍在开发中。值得注意的是,尽管 Codex 应用本身已支持 Windows 平台,部分亮点功能却尚未同步上线,这种平台与区域的分层部署策略可能会对跨平台团队带来不同的采用体验。
竞争格局与行业信号
OpenAI 的这步棋指向了更宏观的行业趋势。模型层的能力释放正在驱动应用层的形态重构,智能体不再局限于单一任务的自动化,而是向着多模态交互、多工具协同、持续运行的系统级产品演进。 Codex 的演进轨迹恰好映射了这一路径:从代码生成工具到桌面控制中枢,再到横跨开发全流程的工作平台。能否在日常操作系统的体验层面建立用户粘性,将是这场转型能否成功的关键。
创艺洞察
这场发布藏着一个值得关注的细节: OpenAI 刻意回避了“编程助手”这一表述,转而强调“日常操作界面”。这不仅是措辞的调整,更是对智能体发展路径的一次宣言。当模型具备了看、点、运行的能力,如何让这些能力无缝嵌入用户真实的工作节奏,而非停留在单点功能的惊艳,将成为下一阶段竞争的分水岭。 Codex 的野心不难读懂:成为开发者打开电脑后第一个启动、最后才关闭的应用。但如果这个目标成立,跨平台一致性、用户隐私边界、以及多智能体并行场景下的资源调度,都将是被持续追问的核心命题。


