从 LLMs 到“幻觉”，一文搞懂常见 AI 术语

AI 术语图谱：理解人工智能产业的核心概念

人工智能领域庞大而复杂，研究人员往往依赖专业术语解释工作内容。理解这些术语，是把握 AI 产业动态的基础。本文系统梳理了该领域最重要的概念框架。

通用人工智能的定义之争

通用人工智能（ Artificial General Intelligence ， AGI ）至今缺乏统一定义。 OpenAI 首席执行官萨姆·奥特曼将 AGI 描述为“可雇佣为同事的普通人类等价智能”。 OpenAI 章程则定义为“在大多数经济价值工作中超越人类的自主系统”。 Google DeepMind 的理解略有不同，认为 AGI 是“至少与人类在大多数认知任务中同样能力的 AI”。三种定义各有权衡，恰恰说明这一领域仍处于探索阶段。

智能体的兴起

智能体（ AI Agent ）是一类利用 AI 技术代替用户执行一系列任务的工具，功能远超基础对话机器人。典型应用场景包括报销处理、机票预订、餐厅预约乃至代码编写维护。值得强调的是，智能体概念仍处于发展期，不同厂商的解读存在差异，支撑其愿景的基础设施也在持续构建中。其核心特征在于自主性。能够调用多个 AI 系统协同完成多步骤任务。

推理与训练

推理（ Inference ）指运行 AI 模型的过程，即让模型基于已学习的数据模式进行预测或得出结论。没有训练就无法进行推理，模型必须先从数据中学习规律，才能有效推演。

训练（ Training ）则是赋予模型学习能力的关键步骤。原始模型仅是随机初始化的数学结构，训练过程使系统逐步适应目标。无论是识别猫的图像还是按需创作俳句。并非所有 AI 都需要训练，规则驱动的线性聊天机器人仅需预设指令即可运作。但训练数据量通常决定模型能力上限，这也是成本居高不下的原因。

大语言模型与神经网络

大语言模型（ Large Language Model ， LLM ）是当前 AI 助手产品的核心技术， ChatGPT 、 Claude 、 Gemini 、 Llama 、 Copilot 等均基于此类模型。 LLM 由数十亿参数构成的深度神经网络组成，通过编码数十亿书籍、文章和文本中的语言模式，学习词汇与短语间的关系，构建多维语言地图。模型根据提示词生成最匹配的模式，再逐词预测下一个最可能的词汇。

神经网络（ Neural Network ）则是支撑深度学习乃至生成式 AI 浪潮的基础架构。其设计灵感源自人脑神经元的密集互联路径，概念可追溯至 1940 年代，但真正释放其潜力的是 GPU 硬件的崛起——游戏产业推动的图形处理器恰好适合训练更深层数的神经网络，使语音识别、自动驾驶、药物研发等领域取得突破性进展。

思维链与推理模型

人类面对简单问题可直觉作答，但复杂问题常需纸笔演算中间步骤。思维链（ Chain of Thought ）推理借鉴这一认知模式，要求大语言模型将问题分解为更小的中间步骤，从而提升最终答案质量，尤其在逻辑推理和编程任务中效果显著。推理模型由传统 LLM 经强化学习优化而来，牺牲响应速度换取更高的准确率。

深度学习与扩散模型

深度学习（ Deep Learning ）是机器学习自我优化能力的子集，采用多层人工神经网络结构，能够发现数据中的复杂关联，无需人类工程师手动定义特征。通过试错与调整的迭代过程，算法可自主改进输出。代价是模型需要海量数据点（通常达百万级以上）且训练周期更长、成本更高。

扩散（ Diffusion ）技术是当前图像、音乐、文本生成 AI 的核心。其原理受物理学启发：系统逐步向数据添加噪声直至信息完全湮灭，再学习“逆扩散”过程从噪声中恢复原始数据，从而获得生成能力。物理中的扩散不可逆，而 AI 系统通过学习逆向过程掌握了这一“重建”本领。

蒸馏与微调

蒸馏（ Distillation ）是一种知识提取技术，采用“教师-学生”模型架构。开发者向教师模型发送请求并记录输出，比对数据集评估答案准确性，再以这些输出训练学生模型，使其近似教师行为。此技术可基于大模型创建更小、更高效的版本， OpenAI GPT-4 Turbo 的开发可能即采用此路径。蒸馏在 AI 行业内部广泛应用，但也可能被部分公司用于追赶前沿模型，通常构成 API 服务条款的违规行为。

微调（ Fine-tuning ）则是针对特定任务或领域进一步优化模型的过程，通过输入专业化数据补充预训练阶段。许多 AI 初创公司以此方式，基于开源 LLM 叠加自有领域知识，打造垂直化商业产品。

生成对抗网络与记忆缓存

生成对抗网络（ Generative Adversarial Network ， GAN ）是一种机器学习框架，支撑了深度伪造等生成式 AI 的重要进展。 GAN 由两个神经网络组成：生成器依据训练数据产生输出，判别器则评估生成结果。两者被设定为竞争关系——生成器试图骗过判别器，判别器持续提升识别能力。这种结构化对抗训练使 AI 输出趋向逼真，但更适合图片、视频等窄领域应用，而非通用 AI 。

记忆缓存（ Memory Cache ）是一种推理优化技术，通过保存特定计算结果供后续查询复用，减少模型运算次数。 KV （键值）缓存是其中较为知名的方案，在 Transformer 架构模型中效果显著，能够缩短响应时间、降低计算开销。

幻觉与专业垂直模型

幻觉（ Hallucination ）是 AI 行业对模型“编造信息”现象的术语定义。生成式 AI 输出可能具有误导性，严重时甚至造成现实危害——例如返回有害的医疗建议。大多数 AI 工具的用户协议现已加入免责声明，但通常远不如答案本身醒目。

幻觉问题的根源在于训练数据的空白。通用基础模型面临的核心困境是：世界上并不存在足够的数据来覆盖人类可能提出的所有问题。这种局限性正推动产业向专业化、垂直化 AI 模型方向发展——针对特定窄领域的专家系统可有效缩小知识盲区、降低虚假信息风险。

计算资源与内存危机

算力（ Compute ）泛指支撑 AI 模型运行的计算能力，是行业发展的燃料。算力常作为 GPU 、 CPU 、 TPU 等硬件的简称，这些芯片构成了现代 AI 产业的基础设施。

“内存灾难”（ RAMageddon ）则是对内存芯片持续短缺的戏称。 AI 产业蓬勃发展之际，各大科技公司与 AI 实验室为争夺最强大、最高效的 AI 系统，大量采购数据中心所需的 RAM 芯片，导致消费市场供给紧张、价格攀升。游戏产业面临显卡涨价、消费电子产业智能手机出货量创十年来最大跌幅、企业计算成本攀升。短缺何时缓解尚无明确时间表。

词元与迁移学习

词元（ Tokens ）是人类与 AI 通信的基本单元，指 LLM 处理或生成的数据离散片段。词元化（ Tokenization ）过程将原始数据分解为模型可消化的最小单位，类似于编译器将人类语言翻译为机器二进制码。输入词元对应用户查询的解析，输出词元构成模型响应，推理词元则涉及更复杂的长程处理流程。在企业 AI 场景中，词元使用量直接决定成本——大多数 AI 服务按量计费。

迁移学习（ Transfer Learning ）指将已训练模型作为新模型的起点，用于开发相关但不同的任务，实现知识复用。该技术可缩短开发周期、节省成本，尤其在目标任务数据有限时具有价值。但局限性同样明显：依赖迁移获得通用能力的模型，通常需要额外数据训练才能在特定领域达到理想表现。

权重与参数

权重（ Weights ）是 AI 训练的核心要素，决定模型对不同特征赋予的重要性程度，从而塑造最终输出。权重本质上是将乘法作用于输入的数值参数。以房价预测模型为例，可纳入卧室数量、浴室数量、房屋类型、停车位等特征权重——这些数值反映各因素对房价的影响程度。模型训练始于随机初始化的权重，随训练推进逐步调整，使输出趋近目标结果。