Gemini 新功能:Canvas、深度研究和个性化的融合
Gemini 推出 Canvas 可视化编辑与零代码网页生成、升级版深度研究(支持溯源追踪与实时思考可见)及基于搜索历史的个性化推荐三大功能,依托 Gemini 2.0 思考模型深度融合,让 AI 助手更自然、可信、主动,逐步成为理解用户、主动服务的个人智能助理。
英伟达将推出两款全新的 AI 加速芯片
英伟达将推两款AI加速芯片:今年下半年发布Blackwell Ultra NVL72,浮点性能与内存容量均提升1.5倍,带宽翻倍并新增注意力指令;明年下半年推出Vera Rubin NVL144,集成自研CPU(性能翻倍、功耗仅50W)、CX9网卡、NVLink6与HBM4,实现全栈升级。
智能体还是智能体工作流
智能体强调大模型驱动的自主决策与非确定性执行,适合复杂灵活任务;智能体工作流则将AI能力嵌入预设流程,强调确定性、可控性与人工干预,更适配需稳定输出的业务场景。二者本质是自主性与可控性的权衡。
Gemini API 函数调用:连接 AI 与现实世界的桥梁
Gemini API 函数调用让模型能将自然语言(如“预订下周二下午3点会议室”)自动转为结构化指令,调用外部API执行真实任务;开发者只需预定义函数声明,执行由后端完成,支持多轮对话与灵活扩展,是大模型连接现实工具的关键能力。
刻薄橘猫 AI 系列影片第一集《深海中的骚动》
刻薄橘猫”推出AI全自动生成动作短剧《深海中的骚动》,讲述动作明星“独眼橘猫”边拍电影边探查片场旁沉没潜艇的荒诞冒险。全程调用Midjourney、Veo2、ElevenLabs等工具完成图像、视频、配音与剪辑,融合高能打斗与黑色幽默。
英伟达推出通用机器人开发平台:Isaac GROOT
英伟达发布通用机器人平台Isaac GROOT,核心模型GROOT N1采用仿人“快慢双系统”架构:慢系统负责感知推理与规划,快系统专注精准执行;依托Omniverse与Cosmos生成海量合成数据,突破动作控制数据瓶颈,支持跨环境、跨形态泛化及后期训练。
半监督学习:AI训练的成本优化之道
半监督学习用少量标注数据+大量未标注数据训练AI,显著降低人工标注成本。通过伪标签、聚类、主动学习等技术,模型能自主挖掘数据规律,提升泛化能力、缓解过拟合,更接近人类“观察—归纳”的学习方式。
Google AI Studio 上线了屏幕实时分享功能
Google AI Studio 新增屏幕实时分享功能,支持串流 Chrome 标签页,让 Gemini 实时“看见”页面内容并语音交互,适用于编程辅助等场景;英文语音识别流畅,中文识别偶有误判为日文的情况。
Google 推出 Gemini 2.0 Flash 原生图像生成功能
Google 正式向所有支持地区开发者开放 Gemini 2.0 Flash 原生图像生成功能,可在 Google AI Studio 和 Gemini API 中调用。它支持文本生成图像、对话式实时编辑、常识推理保障内容合理性,并显著提升图像中文字渲染的准确性,适用于故事配图、广告设计等场景。