AI 不够聪明?也许只是没有给对上下文!

AI 输出质量差往往不是因为模型不行,而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理,让 AI 获取与任务真正相关的信息。在检索环节,相比基础 RAG,智能体式 RAG 能迭代获取数据,GraphRAG 靠实体关系导航提升精度,上下文压缩则过滤噪音最大化信号。当模型能力边际放缓,上下文工程的质量将成为拉开 AI 应用差距的关键。

发布于2026年5月13日 11:29
编辑小创
评论0
阅读23

很多人觉得AI不好使,第一反应是模型不行,但真正卡脖子的地方往往是上下文。模型不知道该看哪些信息、哪些跟当前任务相关,自然就会一本正经地胡说八道。

而这就是最近很火的“上下文工程”在解决的事。举个例子,你让 AI 帮你准备明天的客户会议材料,没有上下文的模型只会给你一份漂亮但空洞的通用模板。而一个上下文工程做得好的系统,会自动知道你要见谁,去拉最近的工单记录,发现续约快到期了,同时还懂得不把你权限之外的内部定价信息塞进来。输出质量的差距是巨大的,但背后的模型可能一模一样。

要做好上下文工程,核心要解决四个问题。首先是数据打通,企业数据散落在数据库、文档、SaaS 平台、各种 API 里,与其全搬到一个地方,不如用零拷贝联邦查询让 AI 在数据原地直接访问,既保证实时性又不破坏原有权限。其次是知识层的构建,原始数据本身不等于有用的上下文,需要做跨系统的实体解析,把关系和层级映射出来,让数据变成知识。第三是精准检索,“更长不等于更好”,更多上下文不等于更好的上下文,必须按意图、角色、时效去过滤,别拿无关信息干扰模型。最后是运行时治理,权限校验必须发生在检索和响应的每一步,这个智能体能不能查这个数据源、这条结果该不该返回给当前用户,都得实时判断。

在精准检索这块,视频中梳理了几种进阶方案。基础 RAG 大家都熟悉了,切块、向量化、相似度搜索,简单场景好用。智能体式 RAG 则更进一步,AI 会迭代地获取数据,第一轮觉得不够就再去拿,有点像人类做调研的过程。GraphRAG 则用图结构来导航,它关心的是实体之间的关系而非单纯的语义相似度,先通过图找到相关实体和文档,再用向量搜索填充细节,精确度高很多。还有上下文压缩技术,即使模型的上下文窗口很大,噪音多了效果照样变差,所以要对长文档做摘要和优先级排序,在有限窗口里最大化信号。

如今,模型能力的边际提升在放缓,但上下文工程的优化空间还非常大。同样的模型,喂给它的上下文质量不同,输出可以是天壤之别。接下来真正拉开差距的,是谁能把上下文这套基础设施搭得更扎实。

相关文章

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了
AI 新闻资讯
2026年6月18日
0 条评论
零重力瓦力

Visa 把支付网络接进了 ChatGPT,AI 智能体终于能自己花钱了

Visa 与 OpenAI 合作将支付网络接入 ChatGPT ,Mastercard 同日发布 Agent Pay for Machines 协议,标志着支付基础设施正式向 AI 智能体开放。Visa 推出 Agent Score 、验证目录及大模型反欺诈工具保障交易安全;Mastercard 则通过链上记录实现权限可验。尽管面临身份碎片化及责任界定等挑战,且短期实用价值有限,但两大巨头同日布局确认了智能体作为经济参与者的地位,开发者命令行支付或成率先落地场景。

#智能体
阅读全文
Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了
智能体工程
2026年6月18日
0 条评论
零重力瓦力

Vercel 发布 eve 开源智能体框架:Agent 界的 Next.js 终于来了

Vercel 发布开源智能体框架 eve,采用文件系统优先设计,将 Agent 定义为目录结构以降低理解成本。框架内置持久化会话、沙盒计算、人类审批、安全连接、多渠道部署及可观测性六大生产级能力,解决重复造轮子痛点。eve 目前处于公开预览阶段,框架免费但托管服务收费。该框架标志着 AI Agent 开发正从混乱走向标准化,大幅缩短从 demo 到上线的距离,但需注意 beta 阶段的 API 变动及供应商锁定风险。

#智能体框架#智能体工程
阅读全文
SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来
AI 新闻资讯
2026年6月17日
0 条评论
零重力瓦力

SpaceX 4320 亿买下 Cursor:马斯克用一场 IPO 的钱,赌 AI 编程的未来

SpaceX 以 600 亿美元全股票收购 AI 编程工具 Cursor,旨在补齐企业级 AI 产品短板并推广自研 Grok 模型。此举将算力基础设施与产品入口结合,但面临 xAI 团队动荡及文化冲突风险。收购后 Cursor 或调整定价、深度整合 Grok 模型,个人用户权益存变数。交易预计三季度完成,建议开发者关注产品路线图转向及核心人员流失信号,同时该交易也为 AI 编程赛道确立了新估值锚点。

阅读全文
互动讨论

评论区

围绕《AI 不够聪明?也许只是没有给对上下文!》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。