AI 不够聪明?也许只是没有给对上下文!

AI 输出质量差往往不是因为模型不行,而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理,让 AI 获取与任务真正相关的信息。在检索环节,相比基础 RAG,智能体式 RAG 能迭代获取数据,GraphRAG 靠实体关系导航提升精度,上下文压缩则过滤噪音最大化信号。当模型能力边际放缓,上下文工程的质量将成为拉开 AI 应用差距的关键。

发布于2026年5月13日 11:29
编辑小创
评论0
阅读25

很多人觉得AI不好使,第一反应是模型不行,但真正卡脖子的地方往往是上下文。模型不知道该看哪些信息、哪些跟当前任务相关,自然就会一本正经地胡说八道。

而这就是最近很火的“上下文工程”在解决的事。举个例子,你让 AI 帮你准备明天的客户会议材料,没有上下文的模型只会给你一份漂亮但空洞的通用模板。而一个上下文工程做得好的系统,会自动知道你要见谁,去拉最近的工单记录,发现续约快到期了,同时还懂得不把你权限之外的内部定价信息塞进来。输出质量的差距是巨大的,但背后的模型可能一模一样。

要做好上下文工程,核心要解决四个问题。首先是数据打通,企业数据散落在数据库、文档、SaaS 平台、各种 API 里,与其全搬到一个地方,不如用零拷贝联邦查询让 AI 在数据原地直接访问,既保证实时性又不破坏原有权限。其次是知识层的构建,原始数据本身不等于有用的上下文,需要做跨系统的实体解析,把关系和层级映射出来,让数据变成知识。第三是精准检索,“更长不等于更好”,更多上下文不等于更好的上下文,必须按意图、角色、时效去过滤,别拿无关信息干扰模型。最后是运行时治理,权限校验必须发生在检索和响应的每一步,这个智能体能不能查这个数据源、这条结果该不该返回给当前用户,都得实时判断。

在精准检索这块,视频中梳理了几种进阶方案。基础 RAG 大家都熟悉了,切块、向量化、相似度搜索,简单场景好用。智能体式 RAG 则更进一步,AI 会迭代地获取数据,第一轮觉得不够就再去拿,有点像人类做调研的过程。GraphRAG 则用图结构来导航,它关心的是实体之间的关系而非单纯的语义相似度,先通过图找到相关实体和文档,再用向量搜索填充细节,精确度高很多。还有上下文压缩技术,即使模型的上下文窗口很大,噪音多了效果照样变差,所以要对长文档做摘要和优先级排序,在有限窗口里最大化信号。

如今,模型能力的边际提升在放缓,但上下文工程的优化空间还非常大。同样的模型,喂给它的上下文质量不同,输出可以是天壤之别。接下来真正拉开差距的,是谁能把上下文这套基础设施搭得更扎实。

相关文章

Superpowers 6.0 把 AI 编程评审重写了一遍:子智能体驱动开发到底怎么运作
智能体工程
2026年6月24日
0 条评论
零重力瓦力

Superpowers 6.0 把 AI 编程评审重写了一遍:子智能体驱动开发到底怎么运作

GitHub 项目 Superpowers 发布 6.0 版本,重写子智能体驱动开发(SDD)方法论,使 AI 编程代码产出速度提升约一倍,token 消耗降低近 50%。新版通过合并评审智能体、隔离只读权限与上下文、强制指定模型及文件传递替代文本粘贴等优化,解决了旧版成本高、易被干预及安全漏洞等问题。该设计思路强调评审环节的重要性,其核心原则可迁移至各类 AI 编程工作流中,有效提升开发效率与质量。

#智能体工程
阅读全文
拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么
智能体工程
2026年6月21日
0 条评论
零重力瓦力

拜耳用 3 层反思循环把 AI 拉进制药生产线:上下文工程和 harness 工程到底在干什么

拜耳制药和 Thoughtworks 在 Martin Fowler 的博客上发表了一篇完整案例,讲他们花了两年多时间把 PRINCE(Preclinical Information Center)从关键词搜索工具演变成多智能体 RAG 系

#智能体工程
阅读全文
Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
互动讨论

评论区

围绕《AI 不够聪明?也许只是没有给对上下文!》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。