LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环

LangChain 推出 LangSmith Engine,将智能体(Agent)的改进流程从手动转变为自动化闭环。针对 Agent 开发中追踪数据庞大、人工排查低效的痛点,LangSmieth Engine 引擎能够自动扫描追踪记录,识别报错、评估失败及用户负反馈等问题,并通过模式匹配聚合同类 Issue 进行优先级排序。基于代码仓库关联,它还能自动生成修复 PR,并创建自定义在线评估器以持续监控问题复发,同时将生产数据纳入离线评估套件防止回归。这一机制实现了“发现问题、修复问题、防止回归”的全自动链路,显著缩短开发周期。

发布于2026年5月22日 13:55
编辑小创
评论0
阅读19

LangChain 发布了 LangSmith Engine,把智能体的改进闭环从手动变成自动化。

做过 Agent 开发的都知道,数据追踪(traces)大家都有,但真正痛苦的是从海量 trace 里找到问题、定位原因、修复、写测试防回归,这套流程全靠人肉,慢且有盲区。LangSmith Engine 就是接管这个过程。

它会自动扫描你的追踪记录,盯住显式报错、在线评估失败、用户负反馈、以及 Agent 没处理好的新场景。发现问题后在整个项目里做模式匹配,把同类问题聚合成一个 issue,按严重程度和频率排优先级。

更有意思的是后面的动作。因为关联了代码仓库,Engine 会直接起草一个 PR,可能是改 prompt,也可能是改代码,你审查合并就行。同时它还会为这个具体问题生成一个自定义在线评估器持续监控,问题复发会自动浮现。最后把相关的生产 trace 加入标注数据集,纳入离线评估套件防回归。

整个链路就是“发现问题 → 修复问题 → 防止回归”的完整自动化闭环。Cogent 和 Campfire 等团队已经在用,解决了影响数千条 trace 的问题。

Agent 开发到了现阶段,瓶颈已经从“能不能跑起来”转移到了“怎么持续提升质量”,谁能把改进循环压缩得更短,谁的 Agent 就能更快变好。LangSmith Engine 本质上是把 SRE 的思路搬到了 Agent 运维里,用自动化观测加闭环修复替代人工巡检。

相关文章

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打
AI 产品工具
2026年6月14日
0 条评论
零重力瓦力

Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打

6 月首周,月之暗面、微软、Google 及 Databricks 密集发布智能体产品,标志着 AI 正从对话助手转向持续行动系统。其中 Kimi Work 主打本地桌面运行,支持多智能体并行与浏览器接管;Microsoft Scout 定位永远在线的个人助理;Google 推出 24 小时信息追踪智能体;Databricks 开源 Omnigent 实现跨智能体互操作。行业共识逐渐形成,智能体将具备自主调度、任务拆解及持续运行能力。

#智能体框架#智能体
阅读全文
互动讨论

评论区

围绕《LangSmith Engine 让 Agent 改进从人肉巡检变成自动闭环》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。