JetBrains Junie 正式版：AI 编程 Agent 学会了用调试器断点

AI 编程 Agent 赛道又来了一位重量级选手。JetBrains 的 Junie 在 6 月 17 日正式脱离 Beta，宣布 GA。这不是改个名字那么简单，核心能力全部翻新了一遍。

先说结论：Junie 做对了一件大多数 AI 编程 Agent 没做对的事，它真正用上了 IDE 的工具链，而非自己造一套近似替代。

SWE-Rebench 榜单第一

在最新一轮 SWE-Rebench（独立 Agent 基准测试）中，Junie 以 61.6% 解决率、72.7% pass@5 的成绩排名第一，超越了 Claude Code、Codex、Cursor 等所有同类 Agent。这个榜每周抽取新鲜任务保持评测诚实，排名会波动，但 Junie 这一轮的数据确实硬。

测试方法也值得注意。Junie 默认使用 Claude Opus 4 (effort=high) 作为主模型，GPT-4.1-mini 和 GPT-4.1 做摘要辅助。也就是说，Junie 的优势不在模型本身，而在它对 IDE 工具的深度调用能力。同一个模型，直接用 Claude Code 跑和套上 Junie 的 harness 跑，效果差距明显。

Plan 模式：先写计划再写代码

AI 编程 Agent 最常见的失败模式是什么？过度自信。Agent 在没搞清楚要做什么的情况下就开始写代码，你 review 的时候发现它解决了错误的问题，浪费的不只是 token，还有你的 review 时间。

Junie 的 Plan 模式把计划变成了一等公民。在写任何代码之前，Junie 会生成一份结构化文档，包含产品需求、技术设计、交付阶段、测试策略，分 tab 展示。你可以直接在编辑器里修改这份计划，确认后再让它实现。

关键区别在于：计划是一个真实文件，存在 .junie/plans 目录下，可以 commit 到版本库，变成活的任务文档。它并非聊天里的一句话。

当需求模糊时，Junie 会主动提问，用多选题和自由回答的方式确认细节，而非猜了再说。这比“更好的提示词”管用得多，因为它把决策权交还给了人类，而非让 Agent 自己拍板。

操作方式：Shift+Tab 进入 Plan 模式，Ctrl+P 打开计划，确认后点 Confirm 开始实现。你可以用贵模型做计划，用便宜模型做实现，成本控制权在你手里。

调试器集成：断点而非 println

这是 Junie 最有差异化的一招。大多数 AI 编程 Agent 遇到 bug 的第一反应是加日志。Junie 的第一反应是打开调试器。

GA 版本的 Junie 可以像人类一样驱动 IDE 的调试器：

启动或加入调试会话，可以运行配置、调试测试、接管已有会话。
设置断点，项目代码、库代码、SDK 代码、甚至反编译的 .class 文件和 JAR 内的源码都行。只要 IDE 能 step into，Junie 就能下断点。
检查真实运行时状态：栈帧、线程状态、表达式求值、run-to-line。

三种调试模式可以灵活组合：

1.“调试并找出这个测试为什么第二次迭代失败” — 全自动，Junie 自己跑完全程。 2.“准备好调试器，我来触发 UI 流程” — Junie 设置好断点等你。 3.“继续我当前的调试会话，告诉我为什么这个值变成 null 了” — 把例行检查交出去，你专注大问题。

目前这个功能在 JetBrains IDE 中完整可用，需要 AI 订阅。

远程控制：开始任务，手机盯进度

Spring Boot 升级、迁移到 Java records、给老服务补测试覆盖，这类长任务不适合 30 分钟的专注会话。Junie 支持异步运行，你从笔记本开始任务，开会时用手机查进度，喝咖啡时 review PR。会话从任何登录设备都能访问。

代码审查：带着项目上下文 review

大多数审查工具在 PR 打开时才第一次看到你的代码库。Junie 用写代码时的同一套项目上下文来 review：构建配置、测试、编码规范、历史决策都在。

三个入口：GitHub Actions 或 GitLab（包括 on-prem）触发，或者用 CLI/插件里的 /review 命令。范围可以选 unstaged、staged、或 diff against main。

交互式走查：Junie 高亮每个有意义的改动，解释设计决策，给 inline 的 accept/reject 控制。发现问题可以当场留 PR 评论。你问一个后续问题，Junie 会根据你关心的点重新排列剩余的 review 顺序，而非按文件名死板走完。

模型自由：成本是旋钮而非属性

Junie 支持任何模型，不锁定。可以用前沿实验室的最新模型，也可以指向本地运行时。LiteLLM、LMStudio、Ollama 都行，加载什么模型就用什么模型，prompt 和代码不外传。

这个设计的核心思路：贵的推理模型用在 Plan 阶段做决策，便宜的模型用在实现阶段做执行。Agent 不会跑偏，你的账单就不会失控。

JetBrains AI 订阅分三档：AI Free 免费 3 个 AI Credit/月，AI Pro 每月 72 元（10 美元）10 个 Credit，AI Ultimate 每月 216 元（30 美元）35 个 Credit。每个 AI Credit 等价 1 美元，按本地货币结算。也可以自带 API Key（BYOK），用 Anthropic、OpenAI、Google 等家的模型。

IDE 集成：Agent 的工具箱是你的 IDE

GA 版本基于 ACP（Agent Communication Protocol）重建了 IDE 集成。同一个引擎驱动 AI Chat、Junie 工具窗口、Junie CLI 三条入口。你的 IDE 的语义索引、构建配置、测试运行器、调试器，Junie 用的都是 IDE 原生的，而非自己模拟的。

还有数据库集成：Junie 可以连上 IDE 里通过 DataGrip 或 JetBrains Database 插件配置的数据库，查询真实数据，在同一个会话里写 SQL、修 SQL、验 SQL。

值不值得用

如果你已经是 JetBrains IDE 用户，Junie 的 GA 版本值得认真试一下。它和那些在编辑器里套壳调 API 的“AI 助手”有本质区别：帮你完成任务，而非帮你补全代码。Plan 模式控制方向不跑偏，调试器集成让 bug 修复有据可查，远程控制让长任务不被打断。

如果你非 JetBrains 用户，Junie 的吸引力取决于你愿不愿意为这套 IDE 生态付钱。它最大的壁垒不在模型能力，而在 IDE 集成深度。在 VS Code 阵营里，GitHub Copilot 的 Agent 模式和 Cursor 的 Composer 在做类似的事，但调试器深度集成这一点，JetBrains 确实领先了一步。

Agent 编程的竞争正在从“谁的模型更强”变成“谁的工具集成更深”。Junie 给出了一个明确答案：用你已有的 IDE 工具，而非重新发明。

SWE-Rebench 榜单第一

Plan 模式：先写计划再写代码

调试器集成：断点而非 println

远程控制：开始任务，手机盯进度

代码审查：带着项目上下文 review

模型自由：成本是旋钮而非属性

IDE 集成：Agent 的工具箱是你的 IDE

值不值得用

引用来源

相关文章

一个人用 Claude 把 53 万行 Zig 重写成 Rust

Claude 自己开机器狗：比人快20 倍，代码量只有十分之一

Visa 把支付网络接进了 ChatGPT，AI 智能体终于能自己花钱了

评论区