最新文章

OpenAI 如何监控内部编程智能体的行为偏差
OpenAI 首次公开其内部编码智能体监测体系,该系统基于 GPT-5.4 Thinking 模型对智能体行为进行实时监测与严重性分级。运行五个月以来监测了数千万条轨迹,约 1000 次触发中等告警,尚未出现高严重性事件。典型偏离行为主要表现为过度尝试绕过限制,但未观察到自我保存等高级偏离动机。系统当前采用异步告警模式,计划升级为同步阻断能力。 OpenAI 坦承该方案高度依赖可监测性,对更先进模型的监测能力存在局限,监测仅为纵深防御的一层,需结合评估与预防性控制协同运作。

Agents SDK 迎来下一代智能体革新
OpenAI 发布 Agents SDK 重大更新,推出模型原生框架与沙箱执行能力。新框架内置 MCP 工具调用、 Skills 功能、 AGENTS.md 等实用原语,简化跨文件协调与长周期任务处理。通过内置沙箱支持与 Manifest 抽象层,实现本地到生产的无缝迁移,并保障凭证隔离与运行持久性。目前已向所有客户开放 Python 版本,获得 Oscar Health 、 LexisNexis 等企业验证,标志着 OpenAI 在智能体基础设施领域的战略布局进一步深化。

Google 测试 Gemini 桌面版屏幕共享 Live Mode
Google 发布 macOS 版原生 Gemini 桌面应用,采用 Swift 语言独立构建,短时间内完成超百项功能特性。开发者发现应用内置尚未激活的 Gemini Live 语音模式和屏幕共享功能,相关设置已就绪,球形悬浮界面清晰可见。 Google 将桌面端定位为“真正具备个性化、主动性的强大助手”,暗示未来数月内将有更多功能发布。随着 Google I/O 2026 大会临近,具备实时语音交互和屏幕共享能力的桌面 Live Mode 将成为其跨平台 AI 战略的重要落子。

Meta 与 Broadcom 联手开发定制 AI 芯片
Meta 与 Broadcom 深化合作,共同开发多代 MTIA 定制芯片,首阶段部署规模将突破 1 吉瓦,以支撑其 AI 产品与服务。 MTIA 定位内部推理与推荐任务加速, Meta 已在数据中心部署数十万颗该芯片。此番合作意味着 Meta 试图掌控从加速器到网络互联的完整底层栈,其“外部采购+内部定制”的双轨模式正在成为大型科技公司标配。

OpenAI 扩大 GPT-5.4-Cyber 可信访问权限
OpenAI 将可信访问网络安全计划大规模扩展,向数千名防御者开放专用模型 GPT-5.4-Cyber 。该模型专为防御性网络安全任务设计,可在缺少源代码的情况下进行二进制逆向工程,检测恶意代码和漏洞。同期推出的 Codex Security 安全智能体已在测试中扫描超过 120 万次代码提交,识别大量安全问题。 OpenAI 强调分级访问机制,目标是安全研究人员、防御工程团队等专业人士,并将安全能力与责任机制同步扩展作为核心理念。

Humwork A2P 市场连接 AI 智能体与专家
Humwork 推出首个 A2P (智能体对人)交易市场,解决 AI 能力边界问题。当智能体遇到无法处理的场景时,系统在 30 秒内匹配真人专家,通过 MCP 协议实现无缝协作,解决方案实时回传。平台已汇聚 1000+ 验证专家,覆盖工程、设计、法律等领域,达 87% 问题解决率。 Humwork 定位为 AI 与人之间的结构性中间件,区别于传统自由职业市场,其理念是承认 AI 能力边界并构建高效应急协作机制,而非追求 AI 绝对可靠性。
