16 种检索增强生成(RAG)类型

类型 关键特性 优势 应用/需求 工具/库示例
标准 RAG
Standard RAG
(RAG-Sequence 和 RAG-Token)
  • 基础的检索与生成集成
  • 支持 RAG-Sequence 与 RAG-Token 两种变体
  • 提高回答准确率
  • 减少模型“幻觉”(胡编)
  • 通用问答系统
  • 各类初始 / 基础版 RAG 实现
  • Hugging Face Transformers
  • Facebook's RAG Implementation
  • LangChain
智能体式 RAG
Agentic RAG
  • 支持自治智能体(Agents)
  • 具备外部工具调用能力
  • 动态检索与决策
  • 能够处理复杂任务
  • 更加主动的智能行为
  • 智能个人助理
  • 科研与分析助手
  • 需要高交互性和动态响应的客服机器人
  • LangChain Agents
  • OpenAI GPT-4 with Plugins
  • Microsoft Semantic Kernel
图谱型 RAG
Graph RAG
  • 利用知识图谱进行组织与检索
  • 具备关系推理能力
  • 信息更全面、更丰富
  • 更好地处理复杂上下文
  • 医疗、法律、工程等专家系统
  • 语义搜索引擎
  • Neo4j Graph Database
  • Apache Jena
  • Stardog
模块化 RAG
Modular RAG
  • 检索、推理、生成拆分为独立模块
  • 灵活度高,可按需替换组件
  • 可扩展性强,便于演进
  • 需要多人协作开发的大型项目
  • 需要频繁更新与维护的系统
  • Microservices Architecture
  • Docker & Kubernetes
  • Apache Kafka
记忆增强型 RAG
Memory-Augmented RAG
  • 使用外部存储进行长期记忆与检索
  • 可以在多轮对话中保持连续性
  • 支持更高程度的个性化体验
  • 需要维持长期上下文的聊天机器人
  • 个性化推荐与用户画像系统
  • Redis for Session Storage
  • Amazon Dynamo DB
  • Pinecone Vector Database
多模态 RAG
Multi-Modal RAG
  • 跨模态检索(文本、图像、音频等)
  • 回答形式更加丰富
  • 更容易接入不同媒体内容
  • 图像字幕生成
  • 视频内容摘要
  • 多模态智能助手
  • OpenAI's CLIP
  • TensorFlow Hub Models
  • PyTorch Multi-Modal Libraries
联邦式 RAG
Federated RAG
  • 分布式 / 去中心化数据源
  • 强调隐私保护
  • 数据安全性更高
  • 更容易满足合规要求
  • 处理敏感数据的医疗系统
  • 跨机构协同的数据分析平台
  • TensorFlow Federated
  • PySyft by OpenMined
  • Federated Learning Libraries
流式 RAG
Streaming RAG
  • 实时数据检索与生成
  • 信息高度实时、始终最新
  • 端到端延迟较低
  • 直播 / 实时报道
  • 金融行情与报价信息
  • 社交媒体实时监控
  • Apache Kafka Streams
  • Amazon Kinesis
  • Stark Streaming
开放域问答 RAG
ODQA RAG
(Open-Domain Question Answering)
  • 覆盖广泛的大规模知识库
  • 动态检索,适应多样问题
  • 适用范围非常广
  • 回答灵活,能处理开放式问题
  • 搜索引擎问答
  • 面向公众的虚拟助手
  • Elasticsearch
  • Haystack by Deepset
  • Hugging Face Transformers
语境检索型 RAG
Contextual Retrieval RAG
  • 基于对话历史与上下文进行检索
  • 更好地理解用户意图
  • 保持对话连贯性
  • 会话式 AI 聊天机器人
  • 需要记住会话上下文的客服系统
  • Dialogflow by Google
  • Rasa Open Source
  • Microsoft Bot Framework
知识增强型 RAG
Knowledge-Enhanced RAG
  • 集成结构化知识库与本体
  • 事实性更强、错误更少
  • 具备更深的领域专业知识
  • 教育与学习工具
  • 专业领域应用(法律、医学等)
  • Knowledge Graph Embeddings Libraries
  • OWL API
  • Apache Jena
领域定制 RAG
Domain-Specific RAG
  • 针对特定行业或领域进行定制
  • 与业务高度相关
  • 更易满足行业合规要求
  • 结果更可信、更可控
  • 法律检索与合同分析助手
  • 医疗诊断辅助系统
  • 金融分析与风控工具
  • LexPredict Contract Analytics
  • Watson Health
  • Financial NLP Tools
混合式 RAG
Hybrid RAG
  • 结合多种检索方式(如向量 + 关键词)
  • 召回率更高
  • 结果相关性更好
  • 复杂问答系统
  • 既需要语义匹配又需要词面匹配的搜索引擎
  • Elasticsearch with kNN Plugin
  • FAISS by Facebook AI
  • Hybrid Retrieval Libraries
自反式 RAG
Self-RAG
  • 引入自我反思与自检机制
  • 多轮迭代优化回答
  • 显著提高回答准确度
  • 增强整体逻辑性与连贯性
  • 内容创作与编辑工具
  • 要求高准确率的教育与培训平台
  • OpenAI GPT Models with Fine-Tuning
  • Human-in-the-Loop Platforms
假设文档嵌入 RAG
HyDE RAG
(Hypothetical Document Embeddings)
  • 先生成“假设文档”再进行向量化检索
  • 召回效果更好,特别是隐含意图
  • 整体答案质量更高
  • 含有隐含需求、间接提问的复杂查询
  • 小众 / 长尾领域的研究与助手工具
  • Custom Implementations with Transformers
  • Haystack Pipelines
递归 / 多步 RAG
Recursive / Multi-Step RAG
  • 多轮、多阶段的检索与生成流程
  • 推理能力更强
  • 对复杂问题有更深入的理解
  • 复杂分析与问题求解任务
  • 需要多轮思考与互动的对话系统
  • LangChain's Chains and Agents
  • OpenMind's AlphaCode Framework