Google 测试 Gemini 桌面版屏幕共享 Live Mode

Google 发布 macOS 版原生 Gemini 桌面应用,采用 Swift 语言独立构建,短时间内完成超百项功能特性。开发者发现应用内置尚未激活的 Gemini Live 语音模式和屏幕共享功能,相关设置已就绪,球形悬浮界面清晰可见。 Google 将桌面端定位为“真正具备个性化、主动性的强大助手”,暗示未来数月内将有更多功能发布。随着 Google I/O 2026 大会临近,具备实时语音交互和屏幕共享能力的桌面 Live Mode 将成为其跨平台 AI 战略的重要落子。

发布于2026年4月16日 13:10
编辑小创
评论0
阅读36

Gemini 新闻

Google 测试支持屏幕共享功能的 Live Mode ,桌面版 Gemini 初现端倪

Google 于 4 月 15 日正式发布 macOS 版原生 Gemini 桌面应用,这款应用采用 Swift 语言独立构建,而非 Electron 框架,这一技术选型本身便透露出 Google 对 Mac 用户体验的重视程度。这支人数不多的开发团队在不足百天时间内完成了超过一百项功能特性,目前应用的功能集合与网页版 Gemini 大致持平,涵盖快捷键唤起、窗口共享等常见能力。然而,对应用内部结构的深入审视揭示出一些尚未激活、但显然已在筹备中的隐藏功能。

💡macOS 版 Gemini 下载链接

在应用设置深处,团队发现了 Gemini Live 语音模式的配置选项,包括可选的多种声音方案,与移动端已上线的 Live Mode 体验如出一辙。这些功能目前仍处于不可用状态,但相关设置的存续清晰指向一个事实: Google 正计划将实时语音对话能力引入桌面端。一旦启用, Gemini Live 将以球形悬浮界面的形态呈现于桌面之上,为用户提供持续性的对话交互入口。此外,相关代码中还发现了 Live Mode 下屏幕共享功能的痕迹,用户可以在对话过程中向 Gemini 展示当前浏览内容,这项能力目前仅在 AI Studio 的 Gemini Live 模型中可用。独立的导航模块设计表明,系统已为 Live 界面与主应用之间的切换预留了过渡通道。

Gemini Live sphere

Gemini Live sphereGemini Live sphereGoogle 将这一定名为“仅仅是个开始”,并明确表示正在构建“一款真正具备个性化、主动性且强大的桌面助手,更多消息将在未来数月内揭晓”。结合即将于 5 月 19 日至 20 日举行的 Google I/O 2026 大会,桌面版 Gemini Live 及其他隐藏功能的正式亮相时间节点已隐约可见。Sundar Pichai 在社交媒体上表示,这是 Gemini 应用首次登陆桌面平台,团队与 Antigravity 部门协作,仅用数日便将创意转化为原生 Swift 应用原型,后续更多功能正在路上。当前版本尚未集成独立的 Gems 标签页或侧边栏中的 NotebookLM 模块,这两项功能在网页版中均可使用,相关缺失预计将在应用迭代过程中逐步填补。对于依赖语音驱动 AI 工作流程的高级用户和专业群体而言,具备屏幕共享能力的原生桌面 Live Mode 将成为 Google 这一跨平台 AI 战略中最具分量的新增筹码。创艺洞察Google 选择以 Swift 重建桌面客户端而非复用既有技术栈,此举绝非仅出于技术洁癖。 Swift 的原生性能与系统级 API 调用能力,为后续深度整合 macOS 系统特性铺设了基础设施层面的便利。而代码中提前埋设的 Live Mode 与屏幕共享接口,则暗示产品团队早已描绘清楚完整的功能图谱,只是选择分阶段释放以控制发布节奏。随着 Google I/O 2026 的临近,桌面端 AI 交互能力正在成为巨头下一轮竞争的关键落子。

相关文章

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟
AI 产品工具
2026年5月28日
0 条评论
零重力瓦力

Stable Audio 3.0 发布:开源音频生成从 11 秒走到 6 分钟

Stability AI 发布开源音频模型 Stable Audio 3.0,最长可生成 6 分 20 秒立体声音频。该模型采用 SAME 架构实现 4096 倍压缩,支持变量长度生成与局部编辑,Small 版本可在移动端离线运行。训练数据均获授权,规避版权风险。提供四个变体及 LoRA 微调文档,社区许可允许商用。此次升级标志着开源音频生成从短音效迈向完整歌曲创作,为开发者提供了本地化、合规的高质量音频生成方案。

#开源模型#AI 音乐
阅读全文
Gemini 3.5 Flash 编码实测
AI 产品工具
2026年5月22日
0 条评论
零重力瓦力

Gemini 3.5 Flash 编码实测

Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升,飞机模型更精致、新增粒子尾焰与地面光照投影,操控手感优化。但整体效果仍不及 GPT 5.5。

#Gemini
阅读全文
谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变
AI 新闻资讯
2026年5月22日
0 条评论
小创

谷歌发布全新视频模型 Gemini Omni,视频编辑迎来质变

Google I/O 大会上,DeepMind 团队推出全新多模态视频模型 Gemini Omni,被视为视频领域的 “Nano Banana”。该模型从底层架构重新设计,支持图像、视频和音频混合输入,通过日常语言即可完成复杂视频编辑。其核心优势在于高可控性和时间维度感知,例如可让画面中的物体凭空消失或改变摄像机视角,同时保持背景与动作一致。用户仅需提供几张照片和一段语音,即可生成高度还原的个人虚拟分身。Omni 还展现出未经过专门训练的涌现能力,如自动同步视频与音乐节奏、根据剧情逻辑续写场景。

#Gemini#视频编辑#视频生成
阅读全文
互动讨论

评论区

围绕《Google 测试 Gemini 桌面版屏幕共享 Live Mode》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。