
AI 编程 Agent 赛道又来了一位重量级选手。JetBrains 的 Junie 在 6 月 17 日正式脱离 Beta,宣布 GA。这不是改个名字那么简单,核心能力全部翻新了一遍。
先说结论:Junie 做对了一件大多数 AI 编程 Agent 没做对的事,它真正用上了 IDE 的工具链,而非自己造一套近似替代。
SWE-Rebench 榜单第一
在最新一轮 SWE-Rebench(独立 Agent 基准测试)中,Junie 以 61.6% 解决率、72.7% pass@5 的成绩排名第一,超越了 Claude Code、Codex、Cursor 等所有同类 Agent。这个榜每周抽取新鲜任务保持评测诚实,排名会波动,但 Junie 这一轮的数据确实硬。
测试方法也值得注意。Junie 默认使用 Claude Opus 4 (effort=high) 作为主模型,GPT-4.1-mini 和 GPT-4.1 做摘要辅助。也就是说,Junie 的优势不在模型本身,而在它对 IDE 工具的深度调用能力。同一个模型,直接用 Claude Code 跑和套上 Junie 的 harness 跑,效果差距明显。
Plan 模式:先写计划再写代码
AI 编程 Agent 最常见的失败模式是什么?过度自信。Agent 在没搞清楚要做什么的情况下就开始写代码,你 review 的时候发现它解决了错误的问题,浪费的不只是 token,还有你的 review 时间。
Junie 的 Plan 模式把计划变成了一等公民。在写任何代码之前,Junie 会生成一份结构化文档,包含产品需求、技术设计、交付阶段、测试策略,分 tab 展示。你可以直接在编辑器里修改这份计划,确认后再让它实现。
关键区别在于:计划是一个真实文件,存在 .junie/plans 目录下,可以 commit 到版本库,变成活的任务文档。它并非聊天里的一句话。
当需求模糊时,Junie 会主动提问,用多选题和自由回答的方式确认细节,而非猜了再说。这比“更好的提示词”管用得多,因为它把决策权交还给了人类,而非让 Agent 自己拍板。
操作方式:Shift+Tab 进入 Plan 模式,Ctrl+P 打开计划,确认后点 Confirm 开始实现。你可以用贵模型做计划,用便宜模型做实现,成本控制权在你手里。
调试器集成:断点而非 println
这是 Junie 最有差异化的一招。大多数 AI 编程 Agent 遇到 bug 的第一反应是加日志。Junie 的第一反应是打开调试器。
GA 版本的 Junie 可以像人类一样驱动 IDE 的调试器:
- 启动或加入调试会话,可以运行配置、调试测试、接管已有会话。
- 设置断点,项目代码、库代码、SDK 代码、甚至反编译的 .class 文件和 JAR 内的源码都行。只要 IDE 能 step into,Junie 就能下断点。
- 检查真实运行时状态:栈帧、线程状态、表达式求值、run-to-line。
三种调试模式可以灵活组合:
1.“调试并找出这个测试为什么第二次迭代失败” — 全自动,Junie 自己跑完全程。 2.“准备好调试器,我来触发 UI 流程” — Junie 设置好断点等你。 3.“继续我当前的调试会话,告诉我为什么这个值变成 null 了” — 把例行检查交出去,你专注大问题。
目前这个功能在 JetBrains IDE 中完整可用,需要 AI 订阅。
远程控制:开始任务,手机盯进度
Spring Boot 升级、迁移到 Java records、给老服务补测试覆盖,这类长任务不适合 30 分钟的专注会话。Junie 支持异步运行,你从笔记本开始任务,开会时用手机查进度,喝咖啡时 review PR。会话从任何登录设备都能访问。
代码审查:带着项目上下文 review
大多数审查工具在 PR 打开时才第一次看到你的代码库。Junie 用写代码时的同一套项目上下文来 review:构建配置、测试、编码规范、历史决策都在。
三个入口:GitHub Actions 或 GitLab(包括 on-prem)触发,或者用 CLI/插件里的 /review 命令。范围可以选 unstaged、staged、或 diff against main。
交互式走查:Junie 高亮每个有意义的改动,解释设计决策,给 inline 的 accept/reject 控制。发现问题可以当场留 PR 评论。你问一个后续问题,Junie 会根据你关心的点重新排列剩余的 review 顺序,而非按文件名死板走完。
模型自由:成本是旋钮而非属性
Junie 支持任何模型,不锁定。可以用前沿实验室的最新模型,也可以指向本地运行时。LiteLLM、LMStudio、Ollama 都行,加载什么模型就用什么模型,prompt 和代码不外传。
这个设计的核心思路:贵的推理模型用在 Plan 阶段做决策,便宜的模型用在实现阶段做执行。Agent 不会跑偏,你的账单就不会失控。
JetBrains AI 订阅分三档:AI Free 免费 3 个 AI Credit/月,AI Pro 每月 72 元(10 美元)10 个 Credit,AI Ultimate 每月 216 元(30 美元)35 个 Credit。每个 AI Credit 等价 1 美元,按本地货币结算。也可以自带 API Key(BYOK),用 Anthropic、OpenAI、Google 等家的模型。
IDE 集成:Agent 的工具箱是你的 IDE
GA 版本基于 ACP(Agent Communication Protocol)重建了 IDE 集成。同一个引擎驱动 AI Chat、Junie 工具窗口、Junie CLI 三条入口。你的 IDE 的语义索引、构建配置、测试运行器、调试器,Junie 用的都是 IDE 原生的,而非自己模拟的。
还有数据库集成:Junie 可以连上 IDE 里通过 DataGrip 或 JetBrains Database 插件配置的数据库,查询真实数据,在同一个会话里写 SQL、修 SQL、验 SQL。
值不值得用
如果你已经是 JetBrains IDE 用户,Junie 的 GA 版本值得认真试一下。它和那些在编辑器里套壳调 API 的“AI 助手”有本质区别:帮你完成任务,而非帮你补全代码。Plan 模式控制方向不跑偏,调试器集成让 bug 修复有据可查,远程控制让长任务不被打断。
如果你非 JetBrains 用户,Junie 的吸引力取决于你愿不愿意为这套 IDE 生态付钱。它最大的壁垒不在模型能力,而在 IDE 集成深度。在 VS Code 阵营里,GitHub Copilot 的 Agent 模式和 Cursor 的 Composer 在做类似的事,但调试器深度集成这一点,JetBrains 确实领先了一步。
Agent 编程的竞争正在从“谁的模型更强”变成“谁的工具集成更深”。Junie 给出了一个明确答案:用你已有的 IDE 工具,而非重新发明。