代码 Agent 的上下文减肥药:SWE-Pruner 是怎么让模型少看多想的

针对代码 Agent 上下文昂贵且易迷失的痛点,SWE-Pruner 提出模仿人类“选择性略读”的策略。该方案通过任务目标引导剪枝,利用 0.6B 小模型动态筛选关键代码片段,而非依赖破坏语法的固定指标。实测显示,其在 SWE-Bench 等任务中 Token 消耗降低 23% 至 54%,成功率反而提升。这一思路为长代码处理提供了新方向,尤其适合需要本地部署或边缘计算的 Agent 落地场景。

发布于2026年5月5日 09:10
编辑零重力瓦力
评论0
阅读43

如今的代码 Agent 动不动就啃几万 Token 的上下文,既贵又慢还容易迷失。SWE-Pruner 认为,不如学学人类程序员“选择性略读”的方式。

怎么做的

论文来自arXiv(2601.16746v2),团队基于一个观察:人类调试代码时不会逐行阅读,而是带着任务目标去“扫”相关部分。比如修 bug 时只看错误处理和调用栈,找性能瓶颈时只看循环和数据库操作。

SWE-Pruner干了三件事

  1. Agent 给自己定一个明确目标,比如“聚焦错误处理”或“关注并发逻辑”,这个目标会变成剪枝的提示。

  2. 训练了一个 0.6 B 的小模型(叫skimmer)来学习如何根据目标选择上下文。

  3. 在四个基准上测试,发现效果不错。在 SWE-Bench Verified 这类 Agent 任务上,Token 减少了 23% 到 54%,成功率反而还提升了。在单轮的长代码问答任务上,最高能压缩 14.84 倍。

为什么值得关注

之前业界做上下文压缩,主要靠困惑度(PPL)这类固定指标,问题是代码有结构,你不能把一个函数切成两半,或者漏掉一个关键的变量声明。PPL导向的压缩会破坏语法和逻辑结构,导致模型理解出错。

SWE-Pruner 的不同在于它是任务感知的。压缩什么、保留什么,是跟着当前任务目标走的。一个需要修 bug 的 Agent 和一个需要写测试的 Agent,会看到不同的上下文。

实用价值在哪儿

对于做 Agent 落地的人来说,这个思路意味着,与其抱怨模型上下文太短,不如让模型学会“看什么像什么”。

具体可以参考的方向有3个:

  1. 给 Agent设计 “目标设定”环节。在执行任务前让模型自己说“这次我关注什么”,这个信号可以被上游的压缩模块用到。

  2. 在代码检索场景里,把任务描述作为相关性判断的依据,而不是只靠语义相似度。

  3. 关注这个 0.6B 的小模型,小到可以本地跑,但能跟大模型配合,在一些边缘部署场景可能有用。

论文链接:https://arxiv.org/abs/2601.16746 Github:https://github.com/Ayanami1314/swe-pruner

相关文章

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
互动讨论

评论区

围绕《代码 Agent 的上下文减肥药:SWE-Pruner 是怎么让模型少看多想的》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。