Microsoft 推出 MAI-Image-2-Efficient :面向大规模商用的低成本图像生成模型
Microsoft 于本周正式发布图像生成模型 MAI-Image-2-Efficient ,主打高速与低成本的平衡表现。这款专为大规模团队场景打造的产品现已同步上线 Microsoft Foundry 模型库与 MAI Playground 。
核心性能指标方面,新模型相比前代 MAI-Image-2 提速约 22%,综合延迟与 GPU 资源消耗后的效率提升达到 4 倍。定价策略同步调整,文本输入 tokens 降至每百万单位 5 美元,图像输出 tokens 降至每百万单位 19.50 美元,整体降幅接近 41%。
Microsoft 将这款产品定位为 MAI 图像系列中的生产级主力型号,而此前的 MAI-Image-2 则继续承担高保真输出任务。涵盖人像摄影级渲染、深度写实风格、需要较长图像内文本的艺术化创作等场景。
从技术规格来看, MAI-Image-2-Efficient 被归类为文生图模型,上下文窗口支持 3.2 万 tokens ,支持 PNG 格式输出,默认英文。输出尺寸最小为 768×768 像素,最大像素总量控制在 1024×1024 等效范围内。
该模型的核心优化方向聚焦于三类场景:实时或对话式工作流、短文本渲染(如标签、标题类元素),以及计算成本敏感的批处理流水线。 Microsoft 在内部测试中指出, MAI-Image-2-Efficient 的平均响应速度较市面主流文生图系统(包括基于 Gemini 和 GPT 的竞品)快约 40%。
首批合作伙伴中, Shutterstock 的反馈显示该模型在提示词还原度与生产级可用性两个维度表现突出。 Microsoft 方面同时透露, MAI-Image-2 系列在 Arena.ai 排行榜中已位列图像模型家族前三甲, WPP 是其大规模应用客户之一。 MAI-Image-2 已逐步落地 Copilot ,并规划分阶段扩展至 Bing 与 PowerPoint 。
当前部署区域覆盖美国中西部、东部、西部,欧洲西部,瑞典中部及印度南部。 MAI Playground 仍处于选择性市场开放状态,美国优先,欧盟地区延后。
随着 MAI-Image-2-Efficient 的推出, Microsoft 在图像生成领域正式形成双层产品矩阵:一款侧重吞吐量与成本效益,另一款专注于顶级输出品质。这一策略与其在 Foundry 平台上构建语音、对话、图像一体化的第一方模型生态的战略方向一致,相关能力均可通过 Azure 直接调用,并配套企业级治理与部署管控工具。
创艺洞察
MAI-Image-2-Efficient 的亮相标志着 Microsoft 在 AI 模型商业化路径上的一次精准卡位。当行业普遍追逐图像生成的上限质量时,这款产品选择了一条更务实的技术路线。不是每家企业都需要生成一张完美的人像大片,更多场景需要的是快速、可复现、低成本的视觉内容产出能力。从 WPP 的规模化采用到 Shutterstock 的生产级反馈,“实用”而非“惊艳”正在成为企业采购图像生成模型的核心评估维度。 MAI-Image-2-Efficient 的出现,既是微软完善 MAI 模型矩阵的战术动作,也是其将 Azure + Foundry 打造成企业 AI 一站式平台的战略延伸。


