Google AI 课堂:智能体从概念到实践
Google AI 课堂指出,智能体无需严苛定义,而应关注“代理性程度”——即调用工具(LLM或硬编码)自主完成任务的能力。它可单点执行(如邮件助手),也能多体协同(如写作+审查组合)。Firebase Genkit、Playbook等开源工具已支持快速构建,适用从简单自动化到复杂场景的各类需求。
AI 超声检测,孕产妇和婴儿的守护者
谷歌健康开发的AI超声技术,让无专业培训的基层医护也能通过智能手机便携设备完成胎儿及乳腺超声检查,在肯尼亚等地显著提升早筛能力;对孕产妇死亡率高、超声医生匮乏的地区尤为关键,正推动优质产科与乳腺癌筛查服务普惠化。
预防先于治疗:AI 赋能乳腺癌早期筛查
谷歌健康AI系统通过分析数千份乳腺X光片,诊断准确率媲美放射科医生,可识别人眼易忽略的微小病变,助力破解医生短缺难题,提升乳腺癌早期筛查效率与可及性;需厘清技术方、医疗机构与监管部门责任边界,推动“上医治未病”落地。
AI 赋能医疗:从印度的实践到中国的未来
印度用AI+移动X光车提升结核病早筛效率,为资源匮乏地区提供可复制的基层诊断范式;中国可借鉴此路径,以AI强化影像识别与远程辅助,改善偏远地区医疗可及性,但需同步构建责任认定、数据隐私与算法公平等监管框架。
谷歌 MedLM:用生成式 AI 革新医疗行业
谷歌推出专为医疗场景优化的生成式AI模型MedLM,基于Med-PaLM 2微调,提供大模型与中等规模两种版本,已上线Vertex AI。正用于临床文书自动整理、药物研发知识挖掘及患者服务优化,助力医生减负、提升诊疗效率与体验。
Google Veo 2 vs OpenAI Sora
Google Veo 2 与 OpenAI Sora 在视频生成风格上走向两极:Sora 偏爱高饱和、超现实的动态表现,擅长奇幻构想;Veo 2 则专注自然色调与符合物理规律的写实运动,更贴近真实世界交互。两者均能精准响应复杂提示词,覆盖日常、科学乃至幻想场景。
谷歌发布全新视频与图像生成技术更新:Veo 2、Imagen 3 和 Whisk
谷歌推出Veo 2、Imagen 3与Whisk:Veo 2支持4K电影级视频生成,可精准控制镜头参数与胶片质感;Imagen 3显著提升图像细节与真实感;Whisk则为创意工作者提供新工具。三者协同强化AI在专业视觉创作中的可控性与表现力。
谷歌推出 Whisk:用图片和 AI 重新定义创意表达
谷歌实验室推出图片驱动AI工具Whisk,支持拖拽图片自动解构为“主题、场景、风格”三要素,并基于Gemini+Imagen 3重组生成全新创意图像。它不复制原图,而是提取视觉精髓,适合数字艺术、贴纸等快速创意探索。
谷歌 DeepMind 推出 AI 天气预测模型:GenCast 准确率创新高
谷歌 DeepMind 推出全球首个高分辨率(0.25°)概率集成AI天气模型GenCast,基于扩散模型与40年ERA5数据训练,单TPU仅需8分钟即可完成15天预测,在97.2%任务上超越ECMWF的ENS系统,尤其擅长极端天气路径预测与风能预报,代码与权重已开源。