OpenAI 为 Codex 应用打造 8 个交互式 Avatar

OpenAI 正在为 Codex 测试 8 个可交互头像功能,用户可在编码时让可视化角色悬浮在屏幕上,以对话气泡形式显示回复。该功能可自由开关,支持自定义,采用像素可爱风格。配合此前推出的 Chronicle 屏幕记忆功能, Codex 正从纯代码工具转向具备人格外观、上下文记忆的桌面型智能体。这一变化代表行业趋势:编程助手不再只强调“写代码更快”,而是强调“持续陪伴开发者工作”,竞争点也从模型质量转向陪伴感与信任感。

发布于2026年5月2日 23:34
编辑小创
评论0
阅读13

OpenAI 正为 Codex 准备 8 个可交互头像,代码助手开始长出“桌面伙伴”形态

OpenAI 正在为 Codex 测试一层新的个性化功能“头像”系统。按目前曝光的信息,用户将可以在设置菜单中选择,或自行创建一个可视化角色,让它在编码过程中以悬浮层形式出现在屏幕上。这个角色不会改变 Codex 的核心能力,但会用类似对话气泡的方式显示回复,把原本偏工具化的开发者产品,往更有“陪伴感”的方向推了一步。

从目前流出的内容看,这项功能支持开关控制。想保留干净工作区的用户,可以直接关闭头像显示,不影响 Codex 的其他功能。换句话说, OpenAI 没有把它做成强制入口,更像是在原有使用流程上叠加一层轻量表达。

首批上线版本预计会提供 8 个预设头像,整体采用像素风格,审美方向明显偏可爱,而不是企业软件常见的冷淡设计。更有意思的是,用户还能自定义头像。这让它不只是一个简单皮肤系统,而更接近一种可编辑的身份界面。放在 OpenAI 近一段时间的产品变化里看,这条路径并不突兀。无论是 ChatGPT 的语音人格,还是各产品线上逐步扩大的个性化选项, OpenAI 都在反复强化“人格感”这件事。

外部曝光的视频还显示,这个头像并不只是静态挂件。它可以被拖动到屏幕任意位置,悬浮在所有窗口之上,还会根据聊天状态显示活跃或空闲状态,并提示是否有多个线程同时运行。这个设计很像把一个原本藏在侧边栏或输入框里的智能体,直接具象化成桌面上的持续存在。对开发者来说,这可能会让 Codex 的存在感变强。对另一部分人来说,也可能显得有点吵。 OpenAI 把它做成可关闭选项,显然也预判到了这种分化。

这项头像功能出现的时间点,也很微妙。就在不久前, OpenAI 刚刚为 Codex 推出了 Chronicle 。这个功能会截取进行中工作的屏幕画面,并把图像上下文交给后台智能体,用来生成“记忆”。它本质上是在给 Codex 增加视觉记忆层,让系统不只理解用户输入的文本,也理解用户屏幕上正在发生什么。

不过, OpenAI 对 Chronicle 的限制相当明确。公司已经提醒用户,开启后会带来更高的 Token 消耗,也会增加提示注入攻击的风险。正因为这些代价和安全隐患,这项功能目前仍处于研究预览阶段,只向 Pro 用户开放,且暂不覆盖欧盟和英国地区,平台上也仅支持 macOS 。 Chronicle 还需要额外申请屏幕录制权限,这说明它调用的是相当底层的系统能力,不是普通意义上的聊天增强。

把 Avatars 和 Chronicle 放在一起看, Codex 的变化就更清楚了。它正在从一个纯粹的代码辅助工具,转向一种持续驻留、具有人格外观、还具备上下文记忆的桌面型智能体产品。这种转向并不是 OpenAI 一家的判断。 Anthropic 、 xAI 和 Google 也都在重新包装各自的智能体式编程工具,不再只强调“写代码更快”,而是强调“这个系统会持续陪着开发者工作”。

目前, OpenAI 还没有正式公布 Avatars 的发布时间。但从产品内部已经出现的准备痕迹看,这项功能距离公开亮相应该不远了。

创艺洞察

Codex 加头像,表面看像是“把工具做可爱”,实质上是在重写人和编程助手的关系。过去的代码助手是调用即响应,现在的方向是常驻、可见、带状态、带记忆。产品一旦走到这一步,竞争点就不只是模型质量了,还会落到陪伴感、打扰阈值和界面信任感这些更微妙的体验细节上。 OpenAI 这次押注的不仅仅是一个头像功能,还是“智能体该不该长期待在你桌面上”这个更大的问题。

相关文章

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字
AI 产品工具
2026年5月7日
0 条评论
零重力瓦力

NVIDIA 开源 Nemotron 3 Nano Omni:一个模型通吃视频音频文字

NVIDIA 开源 Nemotron 3 Nano Omni,以 30B 总参数、3B 激活的混合专家架构,实现视频、音频与文字的统一处理。该模型通过 Mamba 与 Transformer 结合及高效视频采样技术,将多模态推理吞吐量提升最高 9 倍,显著降低延迟与显存占用。相比传统三模型拼接方案,它更适合构建高并发 AI Agent,支持本地消费级显卡运行,已在文档智能、客服等场景验证实际价值。

#开源模型
阅读全文
NVIDIA 给 ComfyUI 装了三把刀:拆层、擦除、转3D,本地一条龙搞定
AI 产品工具
2026年5月7日
0 条评论
零重力瓦力

NVIDIA 给 ComfyUI 装了三把刀:拆层、擦除、转3D,本地一条龙搞定

NVIDIA 开源 GenAI Creator Toolkit,为 ComfyUI 提供三个核心本地工作流:一键图像分层、精准物体擦除及照片转 3D 模型。该工具利用深度估计与生成式 AI 技术,解决商业设计中抠图繁琐、修图不自然及 3D 建模门槛高的问题。支持 RTX 显卡在本地运行,保障数据安全,适用于需要高效处理视觉素材的设计师、视频师及 3D 美术人员,标志着 ComfyUI 向通用创作执行器的关键转变。

#ComfyUI
阅读全文
互动讨论

评论区

围绕《OpenAI 为 Codex 应用打造 8 个交互式 Avatar》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。