什么是上下文工程 如何快速掌握上下文工程

上下文工程是优化大模型有限上下文窗口的关键技术,核心在于适时注入恰好的信息(如指令、记忆、工具描述等),避免干扰与幻觉。常见方法包括写入、选择、压缩和隔离上下文,本质是高效组织信息,提升智能体决策准确性与效率。

发布于2025年10月10日 06:06
编辑零重力瓦力
评论0
阅读33

随着智能体开发的兴起,你可能不止一次听到 “上下文工程” 这个词。它究竟是什么,又该如何掌握这门新的技术?这段来自 LangChain RAG 专家 Lance 的介绍,是我看过的,对 “上下文工程” 解释的最清晰,最实用的一段视频。

所谓 “上下文工程” 就是在用大模型或各种智能体时,怎么把有限的上下文窗口利用好,让模型能更聪明做事的工程技术。上下文工程的本质,就是在合适的时机、放入刚刚好的信息,让后续步骤顺利进行。

上下文这个词其实挺宽泛的,既包括最常见的 “指令”、“提示词”,也包括记忆、事实、工具介绍,甚至是外部知识。智能体的任务往往比较复杂、持续时间更长,经常要调用各种工具,还要处理多轮对话。不知不觉,上下文就变得又长又杂。这会带来各种问题,比如信息冲突、模型注意力分散、无关内容挤占空间,甚至模型开始 “幻想” 出一些莫名其妙的东西。所以,怎么挑选、组织、管理上下文,就成了特别重要的一件事。

常见的做法有几种。第一种是“写入上下文”,其实就是做笔记,把一些中间结果、计划、草稿写下来,必要时随时查阅。比如有的团队会在任务中实时记录推理过程,然后把这些关键信息保存到文件或者数据库里,后面需要的时候就能用得上。像有些聊天机器人,会自动把你的偏好、历史对话整理出来,下次交流还能记得。

第二种是 “选择上下文”,就是把哪些内容拉进来,哪些暂时先放一边,做到有的放矢。比如针对不同问题,只挑选相关的事实、规章、案例,或者用嵌入、知识图谱等方式,从大堆信息里检索最有用的部分。不要让 LLM 在迷失在大量低相关的信息中。

当上下文真的太多,空间又有限时,就需要用到第三种方法 “压缩上下文”。最常见的就是做摘要,把多轮对话、历史数据浓缩成一小段,把关键点提炼出来。或者直接删减,只保留最近几轮、最有用的信息。这样不仅节省空间,还能减少模型混淆的可能。

最后一种方法就是 “隔离上下文”,比如在多智能体系统中,每个智能体各管一摊,谁负责什么主题、用什么工具、处理什么数据,都有自己的 “小黑屋”,互不干扰。这样做的好处是可以并行处理多项任务,还能让每个智能体专注自己的部分。等到需要协作时,再把必要的信息汇总给最终的大模型。

其实这些做法,和我们人类的团队协作、做笔记、查资料很像。归根结底,上下文工程就是在有限的空间里,把信息组织得更加井井有条,让智能体(或者说自动化系统)能少走弯路,做出更靠谱的决策。

相关文章

上下文工程:当提示词工程装不下整个智能体时,谁来接管 AI 的 “工作台”
智能体工程
2026年5月15日
0 条评论
零重力瓦力

上下文工程:当提示词工程装不下整个智能体时,谁来接管 AI 的 “工作台”

“上下文工程” 正取代 “提示词工程”,成为 AI Agent 开发的核心范式。随着模型能力提升、Agent应用普及及企业合规需求,交互重点从单轮指令转向多步骤工作流中的动态信息编排。该领域涵盖系统指令、用户输入、检索知识、对话历史及工具定义五层结构。由于上下文窗口资源有限且易出现中毒、分心等失败模式,需通过ACE框架实现上下文的自进化与增量更新。实操建议包括外部化状态、按需检索、压缩累积及隔离多Agent上下文。本质上,上下文工程是提示词工程的超集,标志着 AI 开发进入以系统架构和状态管理为主导的工程时代。

#上下文工程#智能体工程#提示词工程
阅读全文
AI 不够聪明?也许只是没有给对上下文!
AI 新闻资讯
2026年5月13日
0 条评论
小创

AI 不够聪明?也许只是没有给对上下文!

AI 输出质量差往往不是因为模型不行,而是缺乏有效的上下文。近期备受关注的 “上下文工程” 正是解决这一瓶颈。通过数据打通、知识层构建、精准检索和运行时治理,让 AI 获取与任务真正相关的信息。在检索环节,相比基础 RAG,智能体式 RAG 能迭代获取数据,GraphRAG 靠实体关系导航提升精度,上下文压缩则过滤噪音最大化信号。当模型能力边际放缓,上下文工程的质量将成为拉开 AI 应用差距的关键。

#RAG#上下文工程#智能体工程
阅读全文
如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”
AI 教程知识
2026年5月8日
0 条评论
零重力瓦力

如何解决 Hermes Agent 中 QQ Bot “灵魂不在线”

Hermes QQ Bot 常因网络波动出现“灵魂不在线”的静默断连,根源在于 WebSocket 重连逻辑缺陷导致进程未正常退出。目前修复版本已解决重连耗尽问题,但深层异常捕获仍有待完善。建议用户升级至最新版,配置 systemd 或 Docker 自动重启策略,并优化代理超时设置,以保障 QQ Bot 稳定运行。

#Hermes Agent
阅读全文
互动讨论

评论区

围绕《什么是上下文工程 如何快速掌握上下文工程》展开交流,未登录用户可浏览评论,登录后可参与讨论。

评论数
0
登录后参与评论
支持发表观点与回复一级评论,互动后将同步到消息中心。
登录后评论
暂无评论,欢迎成为第一个参与讨论的人。