
OpenAI Codex 借助 Computer Use 转型为超级应用
OpenAI 将 Codex 升级为全能桌面工作中心,实现从编程助手到工作操作系统的战略跨越。新版本支持多智能体并行控制 macOS 、内置浏览器评论、 GPT-image-1.5 图像生成等功能,整合 90 余个新插件,并确立 GPT-5.4 为推荐模型。目前周活开发者超 300 万,企业用量较年初增长 6 倍。 OpenAI 刻意回避“编程助手”定位,转而强调打造开发者日常操作界面,这标志着智能体正从单点工具向多模态交互、系统级产品演进。

Anthropic 发布 Claude Opus 4.7 模型,覆盖网页、应用和 API
Anthropic 发布 Claude Opus 4.7 ,在代码生成、工作流管理、高分辨率图像理解及指令跟随等方面实现显著突破,新增自主执行与验证复杂项目能力。该模型定价维持不变,同时引入网络安全专项防滥用保障机制,标志着 AI 厂商从“被动合规”向“主动设计安全边界”的转变,为企业用户提供无需额外成本的确定性能力升级。

Opera 推出 Browser Connector ,向 AI 模型传递浏览上下文
Opera 发布 Browser Connector ,通过 MCP 协议将浏览器上下文桥接至 ChatGPT 、 Claude 等主流 AI ,使用户无需手动复制即可推送标签页、页面内容及截图。该功能支持页面导航与屏幕截取,已向 Opera One 和 Opera GX 免费开放。这是 Opera“开放 AI 战略”的延续,将浏览器重新定位为 AI 的上下文数据源层,配合近 3 亿月活用户规模,抢占 MCP 协议标准化前的先机。

Perplexity 为 Computer 测试新版工作流标签
Perplexity 正在为 Computer 开发工作流功能,允许用户从预定义任务流程中选择,通过结构化界面收集输入信息,使交互更接近引导式自动化工具。以 SEO Audit 为例,用户可输入域名并选择审计类型,由并行智能体协同执行。该功能旨在平衡灵活性与一致性,将业务场景封装为可复用模板,满足 B 端用户对稳定输出的需求,标志着 AI 助手从自由对话向结构化工具的演进。

Canva AI 助手新增工具调用功能,自动为你设计
Canva 发布 AI 2.0 ,支持文本描述生成可编辑设计,采用分层架构实现元素独立调整。系统打通报身、邮件、云端等多平台接口,自研模型推理速度提升 5 倍、成本降至三十分之一。企业业务同比增长 100%,最新估值约 420 亿美元,计划明年 IPO 。

Google 现在支持与 AI Mode 并排浏览网页
Google 在 Chrome 桌面版推出 AI Mode 两项新功能:并排打开网页让用户保持搜索上下文直接提问,以及跨标签页搜索整合多来源信息。旨在提供更流畅的对话式搜索体验,让用户无需频繁切换标签页即可获得长文章或视频帮助。这体现了搜索引擎从“提供答案”向“辅助决策”的演进方向。目前仅对美国用户开放,计划扩展至更多地区。

Google 测试 Gemini 桌面版屏幕共享 Live Mode
Google 发布 macOS 版原生 Gemini 桌面应用,采用 Swift 语言独立构建,短时间内完成超百项功能特性。开发者发现应用内置尚未激活的 Gemini Live 语音模式和屏幕共享功能,相关设置已就绪,球形悬浮界面清晰可见。 Google 将桌面端定位为“真正具备个性化、主动性的强大助手”,暗示未来数月内将有更多功能发布。随着 Google I/O 2026 大会临近,具备实时语音交互和屏幕共享能力的桌面 Live Mode 将成为其跨平台 AI 战略的重要落子。

Google 在 Gemini 中测试智能体购物原生结账
Google 正为 Gemini 测试内置购物车功能,计划打造集商品浏览、购买、自动化任务于一体的 AI 商业入口。该功能基于年初发布的“通用商务协议”,可支持用户在 Target 、 Gap 等平台直接结账。结合 Chrome 端 Gemini Skills 和智能体浏览功能, Gemini 有望成为一站式 AI 应用,与 ChatGPT 、 Copilot 等展开正面竞争。预计将在 5 月 Google I/O 大会上正式亮相。

AI 学习应用 Gizmo 获投 2200 万美元,用户突破 1300 万
Gizmo 完成 2200 万美元 A 轮融资。这家 AI 学习平台通过将笔记自动转化为游戏化互动材料,四年内积累 1300 万用户。但从青少年向更广泛用户群体延伸、重建长尾价值,是其跨越“工具型应用”天花板的核心挑战。