追求 Token 最大化：反而让开发者效率降低

AI 写的代码，正在被大量删掉

衡量什么，就会得到什么，这句管理学老话，正在 AI 编程时代遭遇一次尴尬的现实检验。

各家工程效能分析公司的数据，讲述的是同一个故事： AI 工具确实让代码产出量大幅提升，但其中相当比例的代码撑不过几周，就得被工程师推翻重写。数量上去了，质量在漏。

这一问题的核心，在于开发者和管理者所依赖的效率指标本身出了问题。眼下硅谷开发者圈子里， Token 预算，即开发者被授权消耗的 AI 算力额度，已经成为某种身份象征，预算越大，似乎越能彰显工程师地位。但这是一个荒诞的逻辑：衡量的是投入，而非产出。如果一家公司想的是推广 AI 采用率，或者本身就在卖 Token ，这套指标或许说得通。想提升效率的话，它什么都说明不了。

Waydev 的 CEO 兼创始人 Alex Circei 正在构建一套追踪这些动态的智能分析层。他的公司服务于 50 家客户，覆盖超过 1 万名软件工程师。据他观察，工程管理者们看到的代码接受率高达 80% 到 90%，即开发者批准并保留的 AI 生成代码比例。但这个数字掩盖了真正的问题：工程师在随后几周内不得不频繁返工修改，实际有效接受率跌至生成量的 10% 到 30%。

Waydev 成立于 2017 年，原本专注于开发者数据分析。过去六个月，面对快速扩张的 AI 编程工具生态，公司彻底重构了自己的平台，推出了专门追踪 AI 智能体行为元数据的新工具，向工程管理者提供代码质量与成本的分析视图。

来自行业不同角落的数据，指向高度一致的结论。 GitClear 今年 1 月发布的报告指出， AI 工具虽然提升了生产力，但“高频 AI 用户的代码搅动率（ code churn ）平均是非 AI 用户的 9.4 倍”远超工具本身带来的生产力增益。工程分析平台 Faros AI 在其 2026 年 3 月的报告中，基于两年客户数据得出结论：在高度采用 AI 的团队中，代码删除与新增的比例上升了 861%。

Jellyfish 在 2026 年第一季度收集了 7548 名工程师的数据，发现 Token 预算最高的工程师提交了最多的 Pull Request ，但生产力提升并不成比例： 10 倍的 Token 成本，换来的只是 2 倍的吞吐量。工具制造的是体量，不是价值。

与开发者交流，这些数字并不让人意外。代码审查积压、技术债攀升，是高频 AI 用户普遍提及的现象。有一个反复出现的差异：资深工程师和初级工程师对 AI 生成代码的处理方式截然不同，后者更倾向于直接接受，随之而来的是更大规模的后续重写。

大公司也在注意到这一问题。 Atlassian 去年斥资 10 亿美元收购了同类工程智能创业公司 DX ，目的是帮助客户厘清 AI 编程智能体的真实投资回报。

即便如此，开发者们并没有打算回头。 Alex Circei 的判断是：“这是软件开发的新时代，作为公司你必须适应，而且是被迫适应。它不会是一个过去就算了的周期。”

创艺洞察

这篇报道真正有意思的地方，不在于“AI 代码质量存疑”这个早已成为业界共识的结论本身，而在于它揭示了一个指标陷阱的形成机制。 Token 预算作为荣誉标志在开发者文化中的流行，本质上是把工具销售商的商业逻辑内化成了工程师的自我评估标准。这不是第一次发生：当年用代码行数衡量程序员产出时，业界也经历过同样的荒诞阶段。更值得关注的是初级工程师群体，他们在 AI 工具加持下产出了大量代码，却缺乏判断这些代码好坏的经验积累，而这部分隐性的能力退化，在任何现有指标里都找不到踪迹。

AI 写的代码，正在被大量删掉

创艺洞察

相关文章

GPT-5.6 发布当天 OpenAI 自曝 SWE-Bench Pro 30% 有问题

GPT-5.6 Sol Ultra 1 小时证明 60 年未解的图论猜想

AI 正在翻译细胞语言，阿尔茨海默症迎来新转机

评论区