AI 写的代码,正在被大量删掉
衡量什么,就会得到什么,这句管理学老话,正在 AI 编程时代遭遇一次尴尬的现实检验。
各家工程效能分析公司的数据,讲述的是同一个故事: AI 工具确实让代码产出量大幅提升,但其中相当比例的代码撑不过几周,就得被工程师推翻重写。数量上去了,质量在漏。
这一问题的核心,在于开发者和管理者所依赖的效率指标本身出了问题。眼下硅谷开发者圈子里, Token 预算,即开发者被授权消耗的 AI 算力额度,已经成为某种身份象征,预算越大,似乎越能彰显工程师地位。但这是一个荒诞的逻辑:衡量的是投入,而非产出。如果一家公司想的是推广 AI 采用率,或者本身就在卖 Token ,这套指标或许说得通。想提升效率的话,它什么都说明不了。
Waydev 的 CEO 兼创始人 Alex Circei 正在构建一套追踪这些动态的智能分析层。他的公司服务于 50 家客户,覆盖超过 1 万名软件工程师。据他观察,工程管理者们看到的代码接受率高达 80% 到 90%,即开发者批准并保留的 AI 生成代码比例。但这个数字掩盖了真正的问题:工程师在随后几周内不得不频繁返工修改,实际有效接受率跌至生成量的 10% 到 30%。
Waydev 成立于 2017 年,原本专注于开发者数据分析。过去六个月,面对快速扩张的 AI 编程工具生态,公司彻底重构了自己的平台,推出了专门追踪 AI 智能体行为元数据的新工具,向工程管理者提供代码质量与成本的分析视图。
来自行业不同角落的数据,指向高度一致的结论。 GitClear 今年 1 月发布的报告指出, AI 工具虽然提升了生产力,但“高频 AI 用户的代码搅动率( code churn )平均是非 AI 用户的 9.4 倍”远超工具本身带来的生产力增益。工程分析平台 Faros AI 在其 2026 年 3 月的报告中,基于两年客户数据得出结论:在高度采用 AI 的团队中,代码删除与新增的比例上升了 861%。
Jellyfish 在 2026 年第一季度收集了 7548 名工程师的数据,发现 Token 预算最高的工程师提交了最多的 Pull Request ,但生产力提升并不成比例: 10 倍的 Token 成本,换来的只是 2 倍的吞吐量。工具制造的是体量,不是价值。
与开发者交流,这些数字并不让人意外。代码审查积压、技术债攀升,是高频 AI 用户普遍提及的现象。有一个反复出现的差异:资深工程师和初级工程师对 AI 生成代码的处理方式截然不同,后者更倾向于直接接受,随之而来的是更大规模的后续重写。
大公司也在注意到这一问题。 Atlassian 去年斥资 10 亿美元收购了同类工程智能创业公司 DX ,目的是帮助客户厘清 AI 编程智能体的真实投资回报。
即便如此,开发者们并没有打算回头。 Alex Circei 的判断是:“这是软件开发的新时代,作为公司你必须适应,而且是被迫适应。它不会是一个过去就算了的周期。”
创艺洞察
这篇报道真正有意思的地方,不在于“AI 代码质量存疑”这个早已成为业界共识的结论本身,而在于它揭示了一个指标陷阱的形成机制。 Token 预算作为荣誉标志在开发者文化中的流行,本质上是把工具销售商的商业逻辑内化成了工程师的自我评估标准。这不是第一次发生:当年用代码行数衡量程序员产出时,业界也经历过同样的荒诞阶段。更值得关注的是初级工程师群体,他们在 AI 工具加持下产出了大量代码,却缺乏判断这些代码好坏的经验积累,而这部分隐性的能力退化,在任何现有指标里都找不到踪迹。


