追求 Token 最大化:反而让开发者效率降低

AI 编程工具虽大幅提升代码产出量,但质量堪忧。数据显示 AI 生成代码的实际有效接受率仅 10%-30%,代码“搅动率”是非 AI 用户的 9 倍以上。问题根源在于当前效率指标仅衡量投入(如 Token 预算)而非产出,导致开发者追逐体量而非价值。初级工程师因缺乏经验更容易直接接受 AI 代码,后续重写成本更高。业界已意识到这一指标陷阱,工程效能分析工具和企业收购动作相继出现,但 AI 编程趋势不可逆转,开发者需适应这一新范式。

发布于2026年4月18日 15:45
编辑小创
评论0
阅读20

AI 写的代码,正在被大量删掉

衡量什么,就会得到什么,这句管理学老话,正在 AI 编程时代遭遇一次尴尬的现实检验。

各家工程效能分析公司的数据,讲述的是同一个故事: AI 工具确实让代码产出量大幅提升,但其中相当比例的代码撑不过几周,就得被工程师推翻重写。数量上去了,质量在漏。

这一问题的核心,在于开发者和管理者所依赖的效率指标本身出了问题。眼下硅谷开发者圈子里, Token 预算,即开发者被授权消耗的 AI 算力额度,已经成为某种身份象征,预算越大,似乎越能彰显工程师地位。但这是一个荒诞的逻辑:衡量的是投入,而非产出。如果一家公司想的是推广 AI 采用率,或者本身就在卖 Token ,这套指标或许说得通。想提升效率的话,它什么都说明不了。

Waydev 的 CEO 兼创始人 Alex Circei 正在构建一套追踪这些动态的智能分析层。他的公司服务于 50 家客户,覆盖超过 1 万名软件工程师。据他观察,工程管理者们看到的代码接受率高达 80% 到 90%,即开发者批准并保留的 AI 生成代码比例。但这个数字掩盖了真正的问题:工程师在随后几周内不得不频繁返工修改,实际有效接受率跌至生成量的 10% 到 30%。

Waydev 成立于 2017 年,原本专注于开发者数据分析。过去六个月,面对快速扩张的 AI 编程工具生态,公司彻底重构了自己的平台,推出了专门追踪 AI 智能体行为元数据的新工具,向工程管理者提供代码质量与成本的分析视图。

来自行业不同角落的数据,指向高度一致的结论。 GitClear 今年 1 月发布的报告指出, AI 工具虽然提升了生产力,但“高频 AI 用户的代码搅动率( code churn )平均是非 AI 用户的 9.4 倍”远超工具本身带来的生产力增益。工程分析平台 Faros AI 在其 2026 年 3 月的报告中,基于两年客户数据得出结论:在高度采用 AI 的团队中,代码删除与新增的比例上升了 861%。

Jellyfish 在 2026 年第一季度收集了 7548 名工程师的数据,发现 Token 预算最高的工程师提交了最多的 Pull Request ,但生产力提升并不成比例: 10 倍的 Token 成本,换来的只是 2 倍的吞吐量。工具制造的是体量,不是价值。

与开发者交流,这些数字并不让人意外。代码审查积压、技术债攀升,是高频 AI 用户普遍提及的现象。有一个反复出现的差异:资深工程师和初级工程师对 AI 生成代码的处理方式截然不同,后者更倾向于直接接受,随之而来的是更大规模的后续重写。

大公司也在注意到这一问题。 Atlassian 去年斥资 10 亿美元收购了同类工程智能创业公司 DX ,目的是帮助客户厘清 AI 编程智能体的真实投资回报。

即便如此,开发者们并没有打算回头。 Alex Circei 的判断是:“这是软件开发的新时代,作为公司你必须适应,而且是被迫适应。它不会是一个过去就算了的周期。”


创艺洞察

这篇报道真正有意思的地方,不在于“AI 代码质量存疑”这个早已成为业界共识的结论本身,而在于它揭示了一个指标陷阱的形成机制。 Token 预算作为荣誉标志在开发者文化中的流行,本质上是把工具销售商的商业逻辑内化成了工程师的自我评估标准。这不是第一次发生:当年用代码行数衡量程序员产出时,业界也经历过同样的荒诞阶段。更值得关注的是初级工程师群体,他们在 AI 工具加持下产出了大量代码,却缺乏判断这些代码好坏的经验积累,而这部分隐性的能力退化,在任何现有指标里都找不到踪迹。

相关文章

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音
AI 新闻资讯
2026年5月8日
0 条评论
小创

ChatGPT 开始卖广告了,但 OpenAI 真正的野心在语音

5 月 7 日,OpenAI 在英、巴等五国启动 ChatGPT 广告内测,并推出三款具备 GPT-5 级推理能力的实时语音模型。广告业务强调隐私与回答独立性,旨在探索免费用户变现路径。新语音模型则支持复杂任务操作,加速企业付费场景落地。此举标志 OpenAI 从技术验证转向商业模式规模化,证明 AI 产品可兼顾用户体验与多元盈利,为行业商业化提供了关键风向标。

#OpenAI
阅读全文
让 AI 视频拥有电影质感的九层结构提示词
AI 新闻资讯
2026年5月8日
0 条评论
小创

让 AI 视频拥有电影质感的九层结构提示词

如何让 AI 视频拥有电影质感?提示词应采用导演语言而非被动描述,需包含主体、微动作、环境、摄像机、灯光、风格、情绪、物理细节、渲染质量九层结构。文章还总结了微动作工程、摄像机定义、布光逻辑、情绪编码及可控混乱等策略,并提供了多条完整示例。创作者需注意框架易致同质化,真正的竞争壁垒在于对细节分寸和不可模板化判断的把握。

#Runway#视频生成
阅读全文
LM Studio 和 Ollama 到底该选哪个
AI 新闻资讯
2026年5月6日
0 条评论
小创

LM Studio 和 Ollama 到底该选哪个

本地部署大模型时,LM Studio 与 Ollama 各有侧重。前者主打图形化界面,适合快速上手和模型对比。后者作为后台引擎,性能更优且支持自动硬件调用,在自动化工作流中表现更佳。随着版本迭代,两者功能边界虽逐渐模糊,但在 API 兼容性、并发处理及智能体集成方面,Ollama 仍具备明显优势。用户可根据是追求便捷体验还是深度集成需求来选择合适的工具。

#Ollama#开源模型
阅读全文
互动讨论

评论区

围绕《追求 Token 最大化:反而让开发者效率降低》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。