Google 开发自研桌面智能体与 Cowork 竞争

Google 正在推动 Gemini 向智能体驱动的生产力平台转型。 Gemini Enterprise 新增的 Agent 标签页提供任务执行工作台功能,界面设计与 Claude Cowork 高度相似,设有“Require human review”开关暗示支持人工审批机制。此举表明 Google 正在为与 OpenAI 、 Anthropic 在桌面智能体领域的竞争做准备, Gemini 正从对话式 AI 工具向“数字同事”角色进化。

发布于2026年4月14日 12:31
编辑小创
评论0
阅读20

Google 开发桌面智能体,直面 Cowork 竞争

Google 正在加速将 Gemini 打造成更完整的生产力平台。一个明确的信号是: Gemini Enterprise 中出现了一个全新的“Agent”标签页,与标准聊天界面并列放置。这一细节与此前在 Gemini 中发现的变化形成呼应,传递出一个清晰的信号——Google 正在推动两条产品线同时向智能体驱动的方向演进。

这个 Agent 专区提供了两个入口: New Task 和 Inbox 。当用户启动一个任务时,界面会打开一个聊天视图,右侧附带一个信息面板。面板中列出了 Goal 、 Agents 、 Connected apps 、 Files 以及一个名为“Require human review”的开关。这种结构已经超越了传统聊天机器人的范畴,开始呈现出任务执行工作台的形态。

界面的设计逻辑与 Claude Cowork 高度相似。在 Cowork 中,模型被赋予一个目标、获得工具和文件的访问权限,然后驱动一个更复杂的跨步骤工作流程。 Google 的这一尝试,显然意在将 Gemini 从简单的提示词交互中解放出来,构建一个面向多步骤任务的智能体产品。

“Require human review”开关的设置尤其值得注意。尽管部分智能体可能运行在云端,但这个选项的存在暗示 Google 正在为需要人工审批的操作做准备。这不仅指向浏览器端的行为自动化,还暗示着更大的野心——一套能够处理桌面级复杂任务的系统,而非仅仅是一个基于网页的助手。

与此同时, Google 还在持续打磨 Gemini 的 Projects 和 Skills 功能。这些领域的演进轨迹表明,所有这些改变都指向同一个更大的发布周期。 Google 正在将 Gemini 塑造为一个以智能体为核心、具备持久工作流程和关联工具的完整工作平台。

这也是为什么桌面应用的传闻越来越可信的原因。 Google 此前已被曝光正在开发 AI Studio 的桌面客户端,而更大的悬念在于:这两个项目是会保持独立,还是最终整合成统一的产品线。无论如何,方向已经愈发清晰——Google 正在为与 OpenAI 和 Anthropic 在桌面及智能体领域的竞争做准备。

至于 Google 在即将到来的 Google I/O 上会一次性展示多少成果,目前仍是未知数。

创艺洞察

Google 在 Gemini 中嵌入 Agent 标签页的举动,本质上是一次产品定位的重新校准。长期以来, Gemini 被视为一个对话式 AI 工具,但这一次的功能迭代标志着 Google 正在向“数字同事”的方向进化。与其说这是对 Claude Cowork 的直接回应,不如说是 Google 在已有产品矩阵中找到了一个战略性的整合节点。当 Projects 、 Skills 与新的 Agent 模块形成联动, Gemini 的边界正在从聊天框向外大幅延伸。真正值得关注的悬念在于:这套系统最终会以独立应用的形式呈现,还是作为一个深度嵌入 Google 生态的底层能力。无论哪种路径,都将对企业级 AI 市场产生深远影响。

相关文章

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
Google 开源 Agent Executor:你的 AI Agent 终于不用每次断线就从头来了
智能体工程
2026年5月28日
0 条评论
零重力瓦力

Google 开源 Agent Executor:你的 AI Agent 终于不用每次断线就从头来了

Google 开源 Agent Executor(AX),专为生产环境长周期 Agent 设计的分布式运行环境。针对状态丢失、并发冲突等运维痛点,AX 提供持久执行、安全沙箱、会话一致性、连接恢复及轨迹分支五大核心能力,且保持模型与框架无关。配套项目 Agent Substrate 优化了 K8s 资源调度。该项目目前处于早期预览阶段,旨在填补 Agent 落地基础设施空白,建议用于技术预研而非直接投产。

#智能体工程#Google
阅读全文
Gemini 3.5 Flash 编码实测
AI 产品工具
2026年5月22日
0 条评论
零重力瓦力

Gemini 3.5 Flash 编码实测

Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升,飞机模型更精致、新增粒子尾焰与地面光照投影,操控手感优化。但整体效果仍不及 GPT 5.5。

#Gemini
阅读全文
互动讨论

评论区

围绕《Google 开发自研桌面智能体与 Cowork 竞争》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。