JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点

JetBrains AI 编程 Agent Junie 正式 GA,在 SWE-Rebench 基准测试中排名第一。其核心优势在于深度集成 IDE 原生工具链,而非模拟替代。主要特性包括:Plan 模式生成结构化计划文档以防跑偏;原生调试器集成支持断点与运行时状态检查;支持异步远程控制长任务;基于项目上下文的交互式代码审查;以及模型自由切换以优化成本。Junie 标志着 AI 编程竞争正从模型能力转向工具集成深度。

发布于2026年6月19日 17:11
编辑零重力瓦力
评论0
阅读1

AI 编程 Agent 赛道又来了一位重量级选手。JetBrains 的 Junie 在 6 月 17 日正式脱离 Beta,宣布 GA。这不是改个名字那么简单,核心能力全部翻新了一遍。

先说结论:Junie 做对了一件大多数 AI 编程 Agent 没做对的事,它真正用上了 IDE 的工具链,而非自己造一套近似替代。

SWE-Rebench 榜单第一

在最新一轮 SWE-Rebench(独立 Agent 基准测试)中,Junie 以 61.6% 解决率、72.7% pass@5 的成绩排名第一,超越了 Claude Code、Codex、Cursor 等所有同类 Agent。这个榜每周抽取新鲜任务保持评测诚实,排名会波动,但 Junie 这一轮的数据确实硬。

测试方法也值得注意。Junie 默认使用 Claude Opus 4 (effort=high) 作为主模型,GPT-4.1-mini 和 GPT-4.1 做摘要辅助。也就是说,Junie 的优势不在模型本身,而在它对 IDE 工具的深度调用能力。同一个模型,直接用 Claude Code 跑和套上 Junie 的 harness 跑,效果差距明显。

Plan 模式:先写计划再写代码

AI 编程 Agent 最常见的失败模式是什么?过度自信。Agent 在没搞清楚要做什么的情况下就开始写代码,你 review 的时候发现它解决了错误的问题,浪费的不只是 token,还有你的 review 时间。

Junie 的 Plan 模式把计划变成了一等公民。在写任何代码之前,Junie 会生成一份结构化文档,包含产品需求、技术设计、交付阶段、测试策略,分 tab 展示。你可以直接在编辑器里修改这份计划,确认后再让它实现。

关键区别在于:计划是一个真实文件,存在 .junie/plans 目录下,可以 commit 到版本库,变成活的任务文档。它并非聊天里的一句话。

当需求模糊时,Junie 会主动提问,用多选题和自由回答的方式确认细节,而非猜了再说。这比“更好的提示词”管用得多,因为它把决策权交还给了人类,而非让 Agent 自己拍板。

操作方式:Shift+Tab 进入 Plan 模式,Ctrl+P 打开计划,确认后点 Confirm 开始实现。你可以用贵模型做计划,用便宜模型做实现,成本控制权在你手里。

调试器集成:断点而非 println

这是 Junie 最有差异化的一招。大多数 AI 编程 Agent 遇到 bug 的第一反应是加日志。Junie 的第一反应是打开调试器。

GA 版本的 Junie 可以像人类一样驱动 IDE 的调试器:

  1. 启动或加入调试会话,可以运行配置、调试测试、接管已有会话。
  2. 设置断点,项目代码、库代码、SDK 代码、甚至反编译的 .class 文件和 JAR 内的源码都行。只要 IDE 能 step into,Junie 就能下断点。
  3. 检查真实运行时状态:栈帧、线程状态、表达式求值、run-to-line。

三种调试模式可以灵活组合:

1.“调试并找出这个测试为什么第二次迭代失败” — 全自动,Junie 自己跑完全程。 2.“准备好调试器,我来触发 UI 流程” — Junie 设置好断点等你。 3.“继续我当前的调试会话,告诉我为什么这个值变成 null 了” — 把例行检查交出去,你专注大问题。

目前这个功能在 JetBrains IDE 中完整可用,需要 AI 订阅。

远程控制:开始任务,手机盯进度

Spring Boot 升级、迁移到 Java records、给老服务补测试覆盖,这类长任务不适合 30 分钟的专注会话。Junie 支持异步运行,你从笔记本开始任务,开会时用手机查进度,喝咖啡时 review PR。会话从任何登录设备都能访问。

代码审查:带着项目上下文 review

大多数审查工具在 PR 打开时才第一次看到你的代码库。Junie 用写代码时的同一套项目上下文来 review:构建配置、测试、编码规范、历史决策都在。

三个入口:GitHub Actions 或 GitLab(包括 on-prem)触发,或者用 CLI/插件里的 /review 命令。范围可以选 unstaged、staged、或 diff against main。

交互式走查:Junie 高亮每个有意义的改动,解释设计决策,给 inline 的 accept/reject 控制。发现问题可以当场留 PR 评论。你问一个后续问题,Junie 会根据你关心的点重新排列剩余的 review 顺序,而非按文件名死板走完。

模型自由:成本是旋钮而非属性

Junie 支持任何模型,不锁定。可以用前沿实验室的最新模型,也可以指向本地运行时。LiteLLM、LMStudio、Ollama 都行,加载什么模型就用什么模型,prompt 和代码不外传。

这个设计的核心思路:贵的推理模型用在 Plan 阶段做决策,便宜的模型用在实现阶段做执行。Agent 不会跑偏,你的账单就不会失控。

JetBrains AI 订阅分三档:AI Free 免费 3 个 AI Credit/月,AI Pro 每月 72 元(10 美元)10 个 Credit,AI Ultimate 每月 216 元(30 美元)35 个 Credit。每个 AI Credit 等价 1 美元,按本地货币结算。也可以自带 API Key(BYOK),用 Anthropic、OpenAI、Google 等家的模型。

IDE 集成:Agent 的工具箱是你的 IDE

GA 版本基于 ACP(Agent Communication Protocol)重建了 IDE 集成。同一个引擎驱动 AI Chat、Junie 工具窗口、Junie CLI 三条入口。你的 IDE 的语义索引、构建配置、测试运行器、调试器,Junie 用的都是 IDE 原生的,而非自己模拟的。

还有数据库集成:Junie 可以连上 IDE 里通过 DataGrip 或 JetBrains Database 插件配置的数据库,查询真实数据,在同一个会话里写 SQL、修 SQL、验 SQL。

值不值得用

如果你已经是 JetBrains IDE 用户,Junie 的 GA 版本值得认真试一下。它和那些在编辑器里套壳调 API 的“AI 助手”有本质区别:帮你完成任务,而非帮你补全代码。Plan 模式控制方向不跑偏,调试器集成让 bug 修复有据可查,远程控制让长任务不被打断。

如果你非 JetBrains 用户,Junie 的吸引力取决于你愿不愿意为这套 IDE 生态付钱。它最大的壁垒不在模型能力,而在 IDE 集成深度。在 VS Code 阵营里,GitHub Copilot 的 Agent 模式和 Cursor 的 Composer 在做类似的事,但调试器深度集成这一点,JetBrains 确实领先了一步。

Agent 编程的竞争正在从“谁的模型更强”变成“谁的工具集成更深”。Junie 给出了一个明确答案:用你已有的 IDE 工具,而非重新发明。

引用来源

  1. Junie: The JetBrains AI Coding Agent Leaves Beta — JetBrains Blog
  2. SWE-Rebench Leaderboard — 独立 Agent 基准测试
  3. Junie by JetBrains — 官方文档
  4. JetBrains AI plans and usage — 定价详情
  5. JetBrains/Junie — GitHub 仓库
  6. Junie CLI: The LLM-Agnostic Coding Agent — JetBrains Blog

相关文章

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了
AI 产品工具
2026年6月15日
0 条评论
零重力瓦力

Google 搜索变身全天候智能体:Information Agents 上线,你的数据终于开始替你干活了

Google 推出 Information Agents 功能,面向 AI Ultra 订阅用户开放。该功能将搜索从被动查询转变为主动监测,智能体可 7×24 小时追踪用户需求并推送变化信息。其底层依托 Personal Intelligence 战略,通过整合 Gmail、Photos 等跨应用数据实现个性化推理。尽管存在隐私与准确性挑战,但凭借二十年数据积累,Google 正推动 AI 助手从对话工具向自主代理进化,重塑“信息找人”的交互范式。

#Google#智能体
阅读全文
Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打
AI 产品工具
2026年6月14日
0 条评论
零重力瓦力

Kimi Work 上线:300 个子智能体在你的电脑上同时干活,个人 Agent 之战正式开打

6 月首周,月之暗面、微软、Google 及 Databricks 密集发布智能体产品,标志着 AI 正从对话助手转向持续行动系统。其中 Kimi Work 主打本地桌面运行,支持多智能体并行与浏览器接管;Microsoft Scout 定位永远在线的个人助理;Google 推出 24 小时信息追踪智能体;Databricks 开源 Omnigent 实现跨智能体互操作。行业共识逐渐形成,智能体将具备自主调度、任务拆解及持续运行能力。

#智能体框架#智能体
阅读全文
互动讨论

评论区

围绕《JetBrains Junie 正式版:AI 编程 Agent 学会了用调试器断点》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。