Google DeepMind 正式发布 Nano Banana 2 图像生成模型。这是一款将 Pro 级专业能力与 Flash 级极速响应合二为一的新一代图像智能体,即 Gemini 3.1 Flash Image 。核心升级在于:继承 Nano Banana Pro 的先进世界知识、精准文本渲染与主体一致性技术,同时具备闪电般的生成速度。
技术层面, Nano Banana 2 展现出显著的差异化能力。依托 Gemini 实时搜索信息与图像库,模型能够准确渲染特定对象,并支持信息图表、数据可视化等专业场景。文本渲染精度大幅提升,可生成清晰的营销文案、贺卡内容,并支持图像内文字的多语言本地化。主体一致性功能可在一个工作流中维持多达 5 个角色和 14 个对象的视觉特征,确保故事板和叙事创作的连贯性。指令理解能力显著增强,严格遵循复杂提示词的细节要求。输出规格涵盖 512 像素至 4K 分辨率,支持多种宽高比,适应从竖版社交内容到宽幅幕布的全部场景。视觉保真度方面实现照明、纹理与细节的全面升级。
Nano Banana 2 现已面向全球用户开放,集成范围覆盖 Gemini 应用、 Google 搜索 AI Mode 与 Lens 、 AI Studio 、 Vertex AI 、 Flow 及 Google Ads 。其中 Google AI Pro 和 Ultra 订阅用户可通过三点菜单重新生成,继续访问 Nano Banana Pro 进行高保真度任务。搜索功能新增 141 个国家和地区支持,并扩展至 8 种语言。 Flow 平台向所有用户免费开放 Nano Banana 2 图像生成功能。
溯源与内容验证方面, Google 同步强化 SynthID 技术,并与 C2PA Content Credentials 标准深度整合,为用户还原 AI 生成内容的完整创作轨迹。自 2024 年 11 月发布以来, Gemini 应用中的 SynthID 验证功能已被使用超过 2000 万次,覆盖多语言场景。
创艺洞察
Nano Banana 2 的发布折射出生成式 AI 图像领域正在经历一场静默的范式转移。当速度与质量不再是非此即彼的选项,专业级工具的普惠化进程便进入了全新阶段。值得关注的是,主体一致性功能的上限设定——5 个角色与 14 个对象——暗示当前技术仍存在边界约束,而非无限自由。溯源技术的持续加码则表明,可信生成与内容透明正在成为行业竞争的隐性赛道。对于创作者而言,这意味着创作工具的门槛将继续下沉,而真正的竞争焦点或将逐步转向创意本身。


