智谱 AI 发布开源 GLM-5.1 编程模型

智谱 AI 发布 GLM-5.1 编程模型，专为编程和智能体工程设计，可持续运行 8 小时完成规划、执行、测试、修复等全流程任务。基准测试表现亮眼， SWE-Bench Pro 获 58.4 分，超越 GPT-5.4 等竞品。具备 20 万 token 上下文窗口等技术优势，现已面向开发者开放。此举标志着智谱 AI 在编程和智能体基础设施领域迈出关键一步。

发布于2026年4月11日 12:14

编辑小创

评论0 条

阅读53

#AI 模型 #开源模型 #GLM

智谱 AI 发布开源 GLM-5.1 编程模型自主执行时长可达 8 小时

智谱 AI 于 4 月 7 日正式发布 GLM-5.1 ，这是一款专为编程和智能体工程设计的新型旗舰模型。该公司将其定位为突破单次代码生成局限的产物，能够在单一任务中持续运行最长 8 小时，涵盖规划、执行、测试、修复和反复优化等环节，最终输出可直接投入生产环境的成果。智谱 AI 表示，在其评估过的模型中，鲜有产品能在这一时长维度上达到相应水准，而 GLM-5.1 是首款在其测试中实现该水平的国产模型。

基准测试数据印证了这一判断。 GLM-5.1 在 SWE-Bench Pro 中取得 58.4 分，领先于 GPT-5.4 、 Claude Opus 4.6 以及 Gemini 3.1 Pro 。 GitHub 上的技术文档同时显示，该模型在代码库生成和真实终端任务中的表现进一步拉开了与前代 GLM-5 的差距。技术规格方面， GLM-5.1 提供 20 万 token 的上下文窗口、 12.8 万 token 的最大输出上限，并支持深度思考模式和流式工具调用输出，瞄准的是专业开发者而非普通对话用户。

此次发布并非停留在基准测试层面。 GLM-5.1 目前已面向所有 GLM Coding Plan 用户开放，覆盖 Max 、 Pro 和 Lite 三个层级，并同步提供面向 Claude Code 、 OpenClaw 、 Cline 及其他 OpenAI 兼容编程工具的配置指南。在开源层面， GLM-5.1 及 GLM-5.1-FP8 的权重已在官方模型仓库开放下载，网页端 chat.z.ai 的适配仍在推进中。

智谱 AI 此前在海外市场以 Zhipu AI 的名称被认知，路透社将其列为中国 AI 领域的主要竞争者之一，并提及该公司已于今年早些时候完成港股上市。此番 GLM-5.1 的推出清晰传递出这家企业正将产品线持续向编程和智能体基础设施方向纵深布局的战略意图。

GLM 5.2 裸跑击败 Claude Code：Semgrep 安全基准实验里的意外结果

Semgrep 实验显示，开源模型 GLM 5.2 在无脚手架辅助下，IDOR 漏洞检测 F1 达 39%，超越 Claude Code 且单漏洞成本仅 0.17 美元。该模型采用 MoE 架构与 MIT 许可，编码能力接近闭源前沿水平。结果表明模型推理能力提升正缩小脚手架红利，低成本优势或改变安全审计部署策略。尽管结论受限于特定任务，但证实开源模型在安全领域已具备实战竞争力，值得纳入候选池测试。

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

微软研究院联合多所高校发布 Mirage 模型，通过在扩散模型隐空间直接存储三维记忆，解决了 AI 视频生成中场景一致性差及计算昂贵的问题。该方案摒弃传统 RGB 点云渲染流程，使生成速度提升最高 10.57 倍，显存占用降低 55 倍，且长视频边际成本几乎不增。测试显示其三维与光度一致性优于现有方案，虽暂不支持动态物体记忆，但已开源并适用于机器人仿真等静态场景任务。

Google 搜索变身全天候智能体：Information Agents 上线，你的数据终于开始替你干活了

Google 推出 Information Agents 功能，面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测，智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略，通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战，但凭借二十年数据积累，Google 正推动 AI 助手从对话工具向自主代理进化，重塑“信息找人”的交互范式。

#Google#智能体

阅读全文

互动讨论

评论区

围绕《智谱 AI 发布开源 GLM-5.1 编程模型》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

智谱 AI 发布开源 GLM-5.1 编程模型

智谱 AI 发布开源 GLM-5.1 编程模型 自主执行时长可达 8 小时

相关文章

GLM 5.2 裸跑击败 Claude Code：Semgrep 安全基准实验里的意外结果

微软 Mirage：让世界模型学会“过目不忘”，速度快 10 倍、显存省 55 倍

Google 搜索变身全天候智能体：Information Agents 上线，你的数据终于开始替你干活了

评论区

智谱 AI 发布开源 GLM-5.1 编程模型自主执行时长可达 8 小时