LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环

LangChain 推出 LangSmith Engine,将智能体(Agent)的改进流程从手动转变为自动化闭环。针对 Agent 开发中追踪数据庞大、人工排查低效的痛点,LangSmieth Engine 引擎能够自动扫描追踪记录,识别报错、评估失败及用户负反馈等问题,并通过模式匹配聚合同类 Issue 进行优先级排序。基于代码仓库关联,它还能自动生成修复 PR,并创建自定义在线评估器以持续监控问题复发,同时将生产数据纳入离线评估套件防止回归。这一机制实现了“发现问题、修复问题、防止回归”的全自动链路,显著缩短开发周期。

发布于2026年5月22日 13:55
编辑小创
评论0
阅读1

LangChain 发布了 LangSmith Engine,把智能体的改进闭环从手动变成自动化。

做过 Agent 开发的都知道,数据追踪(traces)大家都有,但真正痛苦的是从海量 trace 里找到问题、定位原因、修复、写测试防回归,这套流程全靠人肉,慢且有盲区。LangSmith Engine 就是接管这个过程。

它会自动扫描你的追踪记录,盯住显式报错、在线评估失败、用户负反馈、以及 Agent 没处理好的新场景。发现问题后在整个项目里做模式匹配,把同类问题聚合成一个 issue,按严重程度和频率排优先级。

更有意思的是后面的动作。因为关联了代码仓库,Engine 会直接起草一个 PR,可能是改 prompt,也可能是改代码,你审查合并就行。同时它还会为这个具体问题生成一个自定义在线评估器持续监控,问题复发会自动浮现。最后把相关的生产 trace 加入标注数据集,纳入离线评估套件防回归。

整个链路就是“发现问题 → 修复问题 → 防止回归”的完整自动化闭环。Cogent 和 Campfire 等团队已经在用,解决了影响数千条 trace 的问题。

Agent 开发到了现阶段,瓶颈已经从“能不能跑起来”转移到了“怎么持续提升质量”,谁能把改进循环压缩得更短,谁的 Agent 就能更快变好。LangSmith Engine 本质上是把 SRE 的思路搬到了 Agent 运维里,用自动化观测加闭环修复替代人工巡检。

相关文章

Linear + Claude Code:给 AI 装上项目大脑
AI 新闻资讯
2026年5月22日
0 条评论
小创

Linear + Claude Code:给 AI 装上项目大脑

AI 技术博主 Alex Finn 提出利用免费工具 Linear 将 Claude Code 转化为自主智能体的工作流。该方案要求先将项目拆解为带优先级和验收标准的任务(Issue)录入 Linear,随后 AI 可自动领取任务、编写代码、执行测试并更新状态,全程无需人工干预。此模式有效解决了传统氛围编程中指令中断或偏离的问题,通过 Linear 作为“第二大脑”提供结构化上下文,显著提升产出质量。此外,该流程支持跨设备多智能体协同及 Git 分支管理,配合 Slack 通知实现高效团队协作。

#Claude Code#智能体工程
阅读全文
Gemini 3.5 Flash 编码实测
AI 产品工具
2026年5月22日
0 条评论
零重力瓦力

Gemini 3.5 Flash 编码实测

Gemini 3.5 Flash 在 3D 飞机避障游戏代码生成能力上较 3.1 Pro 有明显提升,飞机模型更精致、新增粒子尾焰与地面光照投影,操控手感优化。但整体效果仍不及 GPT 5.5。

#Gemini
阅读全文
氛围编程的下半场:你的 AI 编程 Agent 已经不需要你的电脑了
AI 编程开发
2026年5月17日
0 条评论
零重力瓦力

氛围编程的下半场:你的 AI 编程 Agent 已经不需要你的电脑了

氛围编程竞争焦点已从代码补全转向云端 Agent 独立完成工程任务。Cursor 推出 Cloud Agent 环境,支持多仓库挂载、环境配置即代码及严格的安全治理。开放 TypeScript SDK,使 Agent 可集成至 CI/CD 或内部产品,实现本地与云端部署对称。同时,Agent Harness 优化通过 Keep Rate 等指标提升模型表现。Mistral Vibe 和 Google Antigravity 亦印证此趋势:编程 Agent 脱离本地束缚,向自主执行、基础设施化演进。

#AI 编程#智能体工程
阅读全文
互动讨论

评论区

围绕《LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。