LLM 工作原理： Prompt Engineering 解析

大语言模型本质是概率引擎，通过 Token 切分和数字编码逐步预测下一个内容。由于概率采样的非确定性特性，输出存在自然波动，这是设计而非缺陷。温度参数控制输出创意度，最大 Token 数限制回复长度， Top-P 核采样限定选词范围，上下文窗口决定记忆容量。实操建议：温度和 Top-P 只调其一，配合最大 Token 数系统性配置，可有效提升提示词工程的可控性。

发布于2026年5月9日 22:09

编辑小创

评论0 条

阅读1

#提示词工程

大语言模型的运作逻辑：提示词工程入门

大语言模型（ LLM ）并不像人类那样阅读文字。它本质上是一台概率引擎，把语言拆碎、编成数字、再预测下一个该出现的内容。理解这个底层机制，是真正驾驭提示词工程（ Prompt Engineering ）的前提。

当一段文字输入 LLM ，模型做的第一件事是把它切分成 Token。 Token 并不等于单词。“dog” 可能就是一个 Token ，而“ButterFly”则可能被拆成“Butter”和“Fly”两个 Token 。切完之后，每个 Token 被转换成一个数字 ID ，模型全程只和这些数字打交道，逐步预测下一个 Token 应该是哪个。不同模型的切分方式不同， GPT 采用字节对编码（ Byte-Pair Encoding ）， BERT 则使用 WordPiece ，同一句话在不同架构下的处理路径可以完全不同。

正因为如此，向 LLM 提同一个问题，两次得到的答案可能并不一致。这不是 bug ，而是模型在从概率分布中采样时的自然结果。它不总是选最可能的那个 Token ，而是按概率随机取样。这种非确定性（ non-deterministic ）特质，是 LLM 与传统程序最根本的区别。

而真正让提示词从“碰运气”变成“可工程化”的，是几个可调节的参数。

温度（ Temperature ）控制的是模型选 Token 时的“冒险程度”。设在 0.0 到 0.3 之间，输出趋于确定和精准，适合事实查询。调到 0.7 到 1.0 ，输出变得更有创意和多样性。超过 1.5 ，输出基本就开始语无伦次了。

最大 Token 数（ Max Tokens ）决定回复的长度上限。粗略换算， 1 个 Token 约等于 0.75 个英文单词。 50 到 150 个 Token 够写一段简短摘要， 500 到 1000 个 Token 可以支撑一篇详细解释， 2000 个 Token 以上才能跑出完整的长文。这个参数是天花板，不是目标长度，设得太低会导致回答在句子中途被截断。

Top-P （核采样， nucleus sampling ）则从另一个维度限定选词范围。设为 0.9 ，意味着模型只从累计概率达到 90% 的 Token 集合里挑选，数值越低，输出越集中。 Funmilola Fagbola （ PhD ）在文中给出了一个实用建议： Temperature 和 Top-P 只调其中一个，同时调两个容易引发不可预期的输出行为。

上下文窗口（ Context Window ）决定模型在单次对话中能“记住”多少内容。早期的 GPT-3.5 只有 8k Token ， Gemini 1.5 Pro 已扩展至超过 100 万 Token ， Claude 3.5 Sonnet 支持 20 万 Token ，相当于约 15 万英文单词或 500 页文本。一旦超出这个上限，模型会悄无声息地丢弃最早的内容，没有任何提示。

多智能体连续工作 16 天，验证契约和串行执行是关键

Factory 工程师 Luke 分享多智能体系统 Missions 架构，核心在于解决人的注意力瓶颈。该系统采用编排、工作、验证三角色分工，强调“先定义完成标准”再写代码，通过串行执行降低协调开销，并强制结构化交接以支撑长周期任务。不同角色匹配专用模型，编排逻辑主要依赖提示词，使团队能同时处理的工作流数量从 10 条提升至 30 条。

Prompt Evolution ：迭代提示词设计让多智能体性能提升 30%

在多智能体系统中，提示词质量而非模型能力才是决定表现的关键。通过对主智能体、分析智能体、编码智能体和评判智能体提示词的系统性演进，工作流效率能够提升 30%。核心方法包括：明确智能体角色边界，将约束显式编码，将编码智能体从“作者”降格为“编译器”，以及依据失败模式驱动迭代。这一实践揭示了工业级 AI 工作流的本质。越确定性的任务越需要确定性的约束，而非期待模型自行领会意图。

高级提示词实用指南：打造精准高质量 AI 图像

文章指出 AI 图像生成效果不佳的根本原因在于提示词质量，而非工具本身。核心观点是使用结构化描述替代模糊指令，将“主体+环境+风格+光线+细节”五个维度纳入提示词。描述越具体， AI 生成方向越明确，随机性越低。常见问题包括概念混搭、关键词堆砌、忽视光线设定等。实用技巧是把提示词当作向朋友描述画面，保持语义连贯。提示词质量直接影响点击率，这种结构化思维与写产品需求文档、设计简报的逻辑相同。

#图像生成

阅读全文

互动讨论

评论区

围绕《LLM 工作原理： Prompt Engineering 解析》展开交流，未登录用户可浏览评论，登录后可参与讨论。

评论数

登录后参与评论

支持发表观点与回复一级评论，互动后将同步到消息中心。

登录后评论

暂无评论，欢迎成为第一个参与讨论的人。

LLM 工作原理： Prompt Engineering 解析

大语言模型的运作逻辑：提示词工程入门

相关文章

多智能体连续工作 16 天，验证契约和串行执行是关键

Prompt Evolution ：迭代提示词设计让多智能体性能提升 30%

高级提示词实用指南：打造精准高质量 AI 图像

评论区