- Sana 图像模型能够生成高达 4096 × 4096 分辨率的图像,支持中文提示词。
- Sana-0.6B 与 Flux-12B 相比,体积小 20 倍,速度快 100 多倍。
- 在 16GB GPU 上部署 Sana-0.6B, 能够在 1 秒内生成 1024 × 1024 的图像。
项目地址:https://nvlabs.github.io/Sana/
试用地址:https://nv-sana.mit.edu/
下载地址:https://github.com/NVlabs/Sana
项目地址:https://nvlabs.github.io/Sana/
试用地址:https://nv-sana.mit.edu/
下载地址:https://github.com/NVlabs/Sana

本指南系统介绍了 AI 基础概念,帮助初学者建立清晰的认知框架。 AI 是一个包含多种技术的广泛领域,其中大语言模型专注于语言处理,其本质是基于上下文预测下一个语言单位。模型训练分为预训练和后训练两个阶段,前者赋予广泛技能,后者负责植入安全准则和交互风格。模型可分为快速响应的非推理模型和深度思考的推理模型,适用于不同场景。理解“AI—模型—大语言模型—产品”四个层级的包含关系,是有效使用 AI 工具的关键。

OpenAI 发布 Codex 重大升级, AI 编程助手新增操控计算机、并行运行、记忆学习等能力,整合 90 余个插件。系统用户已超 300 万,正从辅助工具向“数字同事”角色转变,重新定义开发边界——人类负责决策创意,机器承担执行跟进。

OpenAI 将 Codex 升级为全能桌面工作中心,实现从编程助手到工作操作系统的战略跨越。新版本支持多智能体并行控制 macOS 、内置浏览器评论、 GPT-image-1.5 图像生成等功能,整合 90 余个新插件,并确立 GPT-5.4 为推荐模型。目前周活开发者超 300 万,企业用量较年初增长 6 倍。 OpenAI 刻意回避“编程助手”定位,转而强调打造开发者日常操作界面,这标志着智能体正从单点工具向多模态交互、系统级产品演进。
围绕《Nvidia 推出文生图模型:Sana》展开交流,未登录用户可浏览评论,登录后可参与讨论。