GPT Image 2 发布,文字渲染准确率暴涨到 99%

OpenAI GPT Image 2 虽低调发布,但口碑不俗。其核心突破在于文字渲染准确率跃升至 99%,排版逻辑更自然,且支持多语言融入设计。模型能精准还原胶片相机风格,照片级真实感显著提升,生成速度翻倍并原生支持 2K。尽管存在画面偏暗、密集纹理易糊等不足,但对营销素材制作及日常创作而言,已具备极高的实用价值。

发布于2026年4月29日 09:14
编辑小创
评论0
阅读10

OpenAI GPT Image 2 的发布并不高调,但发布以来的口碑相当不错。

看看作为实际使用者的 AI 创作博主 Alec 是如何评价的。

这次升级最直观的提升是文字渲染,准确率从之前的 60%-70% 直接跳到了 99%。这意味着菜单、产品标签、UI 截图,基本一次生成就能用,对做营销素材的人来说这一项就够回本了。Nano Banana 2 在文字渲染上也不错,但几乎每次都要手动调整图中的文字。

排版能力也跟着上来了。标题、副标题、正文、注释,能按设计逻辑落在该在的位置,不再是硬塞进去的感觉。加上支持 3:1 到 1:3 的灵活宽高比,横幅、竖版各种形式的内容都能做了。

照片级真实感这次也有明显进步。提示词里加入相机和胶片的参考提示,比如 Contax T2 或者 Kodak Portra 800,模型能真实还原这些设备的色彩风格、颗粒感、景深,几乎没有任何 AI 感。

语言方面支持中文、日语、韩语、印地语、孟加拉语,并且是那种将文字融入整体排版的设计。不过混合多种语言的场景还是容易出错,单语言效果最好。

最后说一下缺点,生成图整体偏暗,重复密集的纹理(比如沙粒)容易糊,光照还是会出错。整体和 1.5 比是明显的代差,但和 Nano Banana 2 相比还谈不上碾压,更多是各有取舍。速度快了约 2 倍,原生最高 2K,对于日常工作来说已经相当实用了。

相关文章

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
让 AI 视频拥有电影质感的九层结构提示词
AI 新闻资讯
2026年5月8日
0 条评论
小创

让 AI 视频拥有电影质感的九层结构提示词

如何让 AI 视频拥有电影质感?提示词应采用导演语言而非被动描述,需包含主体、微动作、环境、摄像机、灯光、风格、情绪、物理细节、渲染质量九层结构。文章还总结了微动作工程、摄像机定义、布光逻辑、情绪编码及可控混乱等策略,并提供了多条完整示例。创作者需注意框架易致同质化,真正的竞争壁垒在于对细节分寸和不可模板化判断的把握。

#Runway#视频生成
阅读全文
LM Studio 和 Ollama 到底该选哪个
AI 新闻资讯
2026年5月6日
0 条评论
小创

LM Studio 和 Ollama 到底该选哪个

本地部署大模型时,LM Studio 与 Ollama 各有侧重。前者主打图形化界面,适合快速上手和模型对比。后者作为后台引擎,性能更优且支持自动硬件调用,在自动化工作流中表现更佳。随着版本迭代,两者功能边界虽逐渐模糊,但在 API 兼容性、并发处理及智能体集成方面,Ollama 仍具备明显优势。用户可根据是追求便捷体验还是深度集成需求来选择合适的工具。

#Ollama#开源模型
阅读全文
互动讨论

评论区

围绕《GPT Image 2 发布,文字渲染准确率暴涨到 99%》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。