Nano Banana 2 图像生成能力抢先体验

Nano Banana 2 将于11月11日发布,支持2K原生输出与多种纵横比,采用多步生成+自我纠错机制,在色彩控制、视角调整和文本修正上显著突破;当前预览版基于Gemini 2.5 Flash,代号GEMPIX 2,精度与稳定性提升三倍,或更名“Nano Banana Pro”。

发布于2025年11月9日 09:14
编辑零重力瓦力
评论0
阅读40

MarsEverythingTech, Alexey Shabanov 在 TestingCatalog 上撰文表示 Nano Banana 2 将于 11 月 11 日正式发布,该版本将支持 2 K 原生输出,并在多个关键领域实现重大突破,该模型预计基于 Gemini 3.0 Pro 开发。

Nano Banana 模型在 Gemini 应用及相关 Google 产品中广受好评,Google 正加速推进 Nano Banana 2 的发布工作。这次更新的亮点在于大幅提升了复杂任务的处理能力,包括精确色彩控制、高级视角调整,以及对图像中文本元素的精准修正。这些恰恰是现有版本(Nano Banana 1)存在明显短板的领域。从泄露的图像样本来看,新版本在视觉质量上实现了质的飞跃,成功解决了此前无法处理的诸多问题。

”“
在 Media AI 平台,通过 Nano Banana 2 生成的作品:“赛博朋克风格的黑客机器人正在多屏幕前工作”(图片来源:pic.twitter.com/o1nFaaDks4)

值得一提的是,Nano Banana 2 近期(疑似意外地)在 Media AI 平台上以预览版形式开放了访问。该预览版本的输出效果,与此前在 Gemini 平台短暂上线时确认的 Nano Banana 2 生成结果完全吻合。

根据内部观察,Nano Banana 2 目前仍在使用 Gemini 2.5 Flash 作为底层模型,而非完全升级至 Gemini 3.0 Pro。这一技术选择可能意味着产品将提前发布,待新版基础模型成熟后再进行升级。特别引人注目的是,该模型采用了全新的多步骤生成机制。系统会先花费大量时间进行输出规划,随后生成初始图像,再通过内置的图像分析功能进行自我审查,精准识别并修正错误,必要时进行多轮迭代优化,最终才向用户呈现成品。这种迭代纠错机制在以往版本中从未出现,对于有高精度需求的用户而言意义重大。

9 月 30 日流出的 Nano Banana 2 信息

最新的内部测试结果和 GitHub 代码提交记录显示,该产品正进行品牌升级,新名称为“Nano Banana Pro”,这反映了其在指令理解能力上的显著进步。据称,与早期的 Nano Banana 2 测试版相比,新版本的准确性和稳定性提升了整整三倍。在极限测试场景中,比如模拟“碎片化”后重建图像的任务,该模型展现出了即便在全新会话中也能保持输出一致性的强大能力。

功能层面的更新同样值得关注,新版本扩展了纵横比支持范围(涵盖 1:1、2:3、3:2、3:4、4:3、9:16、16:9 和 21:9),并提供了更丰富的分辨率选项,代码中明确标注了 1 K、2 K 和 4 K 三种输出模式。这些增强功能将为创意工作者和专业用户提供更大的创作灵活性。

”“
Nano Banana 2 生成作品:“雪中,金木研将朋友抱在怀中——《东京食尸鬼》场景”(图片来源:pic.twitter.com/tXWLtyuacF)

目前社区讨论的焦点集中在:Nano Banana 2(内部代号 GEMPIX 2)究竟是基于 Imagen 4 构建,还是延续第一代的做法,继续使用 Gemini 3 Pro 或 Flash。此外,有传言称可能会推出多个产品版本,其中“Nano Banana Pro”很可能会主打高分辨率支持特性。不过,这些信息尚未获得官方证实。从种种迹象来看,正式发布已进入倒计时。内部测试正在紧锣密鼓地进行,Gemini 用户界面中也已出现预告卡片,按照惯例这通常意味着产品将在数日内正式面世。

”“
Nano Banana 2(通过 Media AI 平台生成),图片提供者 x:legit_api

Nano Banana 1 与 Nano Banana 2 对比

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

”“
Nano Banana 1

”“
Nano Banana 2

据了解,GEMPIX 2 的应用范围不会局限于 Gemini 应用本身。Google 正计划将其推广至其他实验性项目,比如 Whisk 实验室项目,这延续了上一代 Nano Banana 模型的多平台部署策略。对于 Google AI 生态系统的广大用户群体。无论是创意从业者、产品设计师还是技术爱好者——此次更新都意味着能够获得更强大的创作控制能力和更高品质的输出效果,这很可能将深刻改变消费级和专业级应用场景中的现有工作流程。关于底层模型的详细规格以及在 Google 生态系统中的具体更新范围,所有答案都将在正式发布时揭晓。

相关文章

Runway 不想只做视频工具了
AI 新闻资讯
2026年5月16日
0 条评论
零重力瓦力

Runway 不想只做视频工具了

Runway 估值达 530 亿,正从视频生成工具转型构建 AI 世界模型。其核心逻辑是利用视频数据中蕴含的物理规律,弥补文本数据的偏见,目前已发布 Gen-4.5 并规划了交互式模拟、机器人训练等五步路线图。凭借好莱坞付费用户形成的反馈闭环与经常性收入,Runway 具备较强商业基础。尽管面临算力瓶颈及 Google、Luma 等激烈竞争,且 Sora 退出留下市场真空,但 Runway 通过“先有生意再有研究”的策略,试图验证视频生成通向世界理解的工程化路径。

#世界模型#Runway
阅读全文
Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?
AI 新闻资讯
2026年5月15日
0 条评论
小创

Anthropic 两千亿估值一夜作废,是 AI 泡沫破了吗?

Anthropic 宣布作废未经董事会批准的二级市场员工股转让,导致其估值短期内大幅缩水,引发关于 AI 泡沫破裂的讨论。由于公司未上市,员工套现依赖私募渠道,中间商通过 SPV 层层转卖并收取高额手续费,造成交易混乱且投资者权益缺乏保障。Anthropic 明确不认可此类灰色渠道交易,使大量散户面临资金损失风险。此外,AI 巨头如 OpenAI、xAI 和 Anthropic 的股权高度集中,少数早期员工巨额套现加剧了财富分配不均。尽管行业技术飞速发展,但普通民众难以参与核心利益分配。

#Anthropic
阅读全文
Grok 4.3 被低估的隐藏工作流全解析
AI 新闻资讯
2026年5月13日
0 条评论
小创

Grok 4.3 被低估的隐藏工作流全解析

Grok 4.3 近期更新后,多数用户仍停留在简单问答模式。AI Master 的实操演示显示,这款工具的真正价值在于工作流整合:Fast/Auto/Expert 三档模式分工明确,Expert 模式下追加"什么条件变化会让你改变答案"可逼出明确结论而非模棱两可的套话。深度嵌入的搜索支持一键生成带引用的舆情分析,"反向观点扫描"能在信息茧房中找出盲区。任务功能可设定周期性指令自动运行,相当于零成本的专职信息助理;结构化输出配合内置 Python 执行,上传 CSV 直接出图表,省去本地配置环境的

#Grok#智能体工程
阅读全文
互动讨论

评论区

围绕《Nano Banana 2 图像生成能力抢先体验》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。