
最佳 AI 语音转文字应用实测排行
AI 语音输入应用已从“识别准确”转向多维度竞争。主流产品各具特色:本地隐私型( Monologue 、 VoiceTypr )、工作流整合型( Wispr Flow )、低价买断型( VoiceInk 、 Dicatto )等。竞争焦点已不限于识别率,而是隐私保护、场景适配和“写作起点”的争夺。谁更懂用户在不同场景的表达意图,谁就能占据内容生产流程的先机。

认识 Noscroll :替你刷负面新闻的 AI 智能体
新创公司 Noscroll 推出 AI 智能体服务,通过短信替你追踪 X 、 Reddit 等平台信息流,过滤噪声后仅推送重要内容。由 OpenSea 前 CTO 创办,灵感源于对信息平台上瘾又不想错过的矛盾体验。用户可定制信源、定时收摘要、突发新闻即时通知。订阅每月 9.99 美元。它将大模型从被动问答变为主动代理,用短信这一低门槛渠道,帮用户把无尽下滑的 feed 压缩成几行文字。

AI Overviews 即将登陆你的工作 Gmail
Google 在 Cloud Next 大会上将 AI Overviews 引入 Gmail ,用户可用自然语言提问获取邮件摘要。系统从多封邮件中提取内容,生成即时答案,适用于绩效、项目进度、发票等业务信息场景。此功能此前仅面向消费者,现扩展至商业、企业和教育版 Workspace 。分析认为, Google 正将 Workspace 从办公软件转向“答案分发系统”,搜索不再只是检索,开始承担理解、归纳和裁决的角色。

Google Maps 即将迎来 AI 功能大升级
谷歌在 Cloud Next 大会上发布企业级生成式 AI 地图功能,包括 Maps Imagery Grounding (用 AI 生成 Street View 场景)、 Aerial and Satellite Insights ( BigQuery 影像分析)和 Earth AI Imagery 模型(自动识别道路、桥梁等对象)。这些更新将地理空间数据、生成式 AI 与企业分析工具深度整合,旨在把 Google Maps 从展示工具升级为具备空间语义的企业智能平台,大幅降低企业开发门槛。
微软开源 Agent Governance Toolkit:AI Agent 的安全终于有人管了
微软开源 Agent 治理工具包 AGT,覆盖 OWASP 全部 10 类安全风险。该工具借鉴操作系统模型,通过工具扫描、调用前策略检查及响应审查三层机制,将安全从提示词建议升级为代码硬约束。其策略评估延迟不足 1 毫秒,支持多语言及主流框架集成。在监管趋严背景下,AGT 为开发者提供了管控 Agent 外部动作的有效基础设施,虽不干预内部推理,但填补了当前执行层的安全空白。
Grok Imagine “智能体模式”来了!
马斯克旗下 Grok Imagine 推出智能体模式,将创意工作流整合至无限画布。用户可在同一页面通过对话完成头脑风暴、图片生成编辑及视频制作,无需跳转工具。该功能支持从模特图生成到拍摄角度咨询的全流程操作,适合需要高效产出广告或视觉内容的创作者,实现思考与创作的一站式闭环。
没装摄像头的 AI 眼镜,如何成为第二大脑
Mira 是一款主打 “记忆 + 执行” 的 AI 智能眼镜,通过持续录音将对话转化为可搜索的个人上下文档案。它不仅能实现 900 毫秒内的多语言实时字幕翻译,还能基于记忆自动处理邮件、日程及支付等任务。配合支持手势操作的戒指,用户无需掏手机即可交互。设备仅重 39 克且无摄像头,承诺不利用对话数据训练模型,适合追求隐私与高效语音助手的用户。

Anthropic 为企业推出 Claude 智能体记忆功能
Anthropic 为企业版 Claude 智能体推出 Memory 功能,以文件系统层实现跨会话记忆存储。该功能强调可审计、可控、可回滚的企业级特性,支持 API 管理和权限控制,所有变更均有审计轨迹。与单纯扩展上下文不同, Anthropic 将记忆纳入可编程、可导出、可治理的管理框架,瞄准需要稳定、可追踪智能体能力的企业场景。 Netflix 、 Rakuten 等企业已开始使用。

Google 发布 Gemini Enterprise 智能体平台
Google 发布新版 Gemini Enterprise ,将其从聊天工具升级为面向大型企业的统一智能体平台。新平台整合了应用开发入口 Agent Platform 、员工使用入口及安全治理框架,支持开发者、 IT 团队和知识工作者构建、管理和治理跨工作流的 AI 智能体。平台整合 200 多个模型,提供低代码工具、多智能体系统及长时运行能力,并配备身份认证、注册与策略执行等完整安全机制。 Google 此举旨在解决企业 AI 碎片化问题,但平台越完整也意味着企业越容易被锁进生态。