Skip to content

Agentic RAG 架构分类

从单智能体到复杂层级系统:七种核心架构详解


架构概览

Agentic RAG 系统根据复杂度和适用场景,可分为七种主要架构类型:

架构类型复杂度核心特征适用场景
单智能体路由集中决策简单多源检索
多智能体系统专业分工高并发复杂查询
层级系统多级监督企业级应用
纠正式 RAG自我纠错高准确性需求
自适应 RAG动态策略混合复杂度查询
图增强 RAG关系推理知识图谱场景
文档工作流端到端自动化企业文档处理

一、单智能体路由架构(Single-Agent Router)

单智能体路由是最简洁的 Agentic RAG 架构,由一个统一的智能体管理所有检索、路由和信息整合任务。

单智能体 RAG图 1:单智能体 Agentic RAG 架构

工作流程

用户查询


┌─────────────────────────────────────┐
│         协调智能体(Router)          │
│   分析查询 → 选择数据源 → 协调检索     │
└─────────────────────────────────────┘

    ├─→ 向量数据库(语义检索)

    ├─→ SQL 数据库(结构化查询)

    ├─→ Web 搜索(实时信息)

    └─→ 推荐系统(个性化内容)


LLM 整合生成 → 最终响应

核心优势

  • 集中简化:单一智能体处理所有任务,降低系统复杂度
  • 动态路由:实时评估查询,选择最优数据源
  • 灵活适配:支持多种工具类型
  • 低开销:计算资源需求较少

局限性

  • 当工具数量过多时,选择效率下降
  • 无法并行处理复杂多领域查询
  • 单点故障风险

适用场景

  • 工具/数据源数量有限(<10个)
  • 查询类型相对明确
  • 对响应延迟敏感的应用

二、多智能体系统(Multi-Agent System)

多智能体架构将职责分配给多个专业化智能体,每个智能体专注于特定数据源或任务类型。

多智能体 RAG图 2:多智能体 Agentic RAG 架构

工作流程

用户查询


┌─────────────────────────────────────┐
│         主协调智能体                  │
│      接收查询 → 任务分配              │
└─────────────────────────────────────┘

    ├─────────────────────────────────┤
    │           并行处理               │
    │                                 │
    │  ┌─────────┐  ┌─────────┐      │
    │  │SQL 专家  │  │语义检索  │      │
    │  │智能体   │  │智能体   │      │
    │  └─────────┘  └─────────┘      │
    │                                 │
    │  ┌─────────┐  ┌─────────┐      │
    │  │Web 搜索 │  │推荐系统 │      │
    │  │智能体   │  │智能体   │      │
    │  └─────────┘  └─────────┘      │
    │                                 │
    ├─────────────────────────────────┤


结果聚合 → LLM 整合 → 最终响应

核心优势

  • 模块化:智能体可独立添加、删除、升级
  • 并行处理:多智能体同时工作,提升吞吐量
  • 专业优化:每个智能体针对特定任务优化
  • 容错性:单个智能体失败不影响整体

设计挑战

  • 协调复杂:需要有效的通信和同步机制
  • 计算开销:多智能体运行增加资源消耗
  • 数据整合:来自不同源的信息需要高效整合

适用场景

  • 大规模数据源(10+)
  • 高并发查询需求
  • 需要专业化处理的多领域应用

三、层级架构(Hierarchical System)

层级架构通过多层智能体结构实现战略决策和资源分配,高层智能体监督低层智能体。

层级 RAG图 3:层级 Agentic RAG 架构

架构设计

                    ┌─────────────────┐
                    │  顶层智能体      │
                    │ (战略决策层)     │
                    └────────┬────────┘

              ┌──────────────┼──────────────┐
              ↓              ↓              ↓
        ┌──────────┐  ┌──────────┐  ┌──────────┐
        │中层智能体 │  │中层智能体 │  │中层智能体 │
        │(领域协调) │  │(领域协调) │  │(领域协调) │
        └─────┬────┘  └─────┬────┘  └─────┬────┘
              │              │              │
         ┌────┴────┐    ┌────┴────┐    ┌────┴────┐
         ↓         ↓    ↓         ↓    ↓         ↓
      ┌─────┐  ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────┐
      │执行者│  │执行者│ │执行者│ │执行者│ │执行者│ │执行者│
      └─────┘  └─────┘ └─────┘ └─────┘ └─────┘ └─────┘

层级职责

层级职责能力
顶层战略决策任务评估、资源优先级、数据源排序
中层领域协调子任务分配、领域内优化
底层任务执行具体检索、数据处理

核心优势

  • 战略优先级:顶层智能体根据可靠性和相关性排序数据源
  • 可扩展性:通过分布式处理应对复杂多面查询
  • 决策增强:多层监督提升准确性和连贯性

适用场景

  • 企业级知识管理系统
  • 多部门协作场景
  • 需要审批流程的敏感应用

四、纠正式 RAG(Corrective RAG / CRAG)

纠正式 RAG 引入自我纠错机制,动态评估检索结果的相关性,并在不足时触发纠正措施。

纠正式 RAG图 4:纠正式 Agentic RAG 架构

核心机制

用户查询


初始检索 → 相关性评估

         ┌────┴────┐
         ↓         ↓
      相关       不相关
         │         │
         ↓         ↓
     直接使用    触发纠正

              ┌────┴────┐
              ↓         ↓
          查询重写   外部检索
              │         │
              └────┬────┘

              重新检索


              再次评估...

五大专业智能体

智能体功能
上下文检索从知识库获取初始文档
相关性评估评估文档与查询的匹配度
查询重写优化查询以提高检索精度
外部知识检索当内部知识不足时访问外部资源
响应合成整合信息生成最终响应

核心优势

  • 迭代纠正:动态识别不相关结果并修正
  • 动态适应:实时整合外部信息(Web 搜索)
  • 事实保证:最小化幻觉和错误信息风险

适用场景

  • 对准确性要求极高的应用(医疗、法律)
  • 知识库可能不完整的场景
  • 需要实时信息补充的应用

五、自适应 RAG(Adaptive RAG)

自适应 RAG 根据查询复杂度动态选择处理策略,实现资源的最优分配。

自适应 RAG图 5:自适应 Agentic RAG 架构

核心原理

用户查询


┌─────────────────────────────────────┐
│         复杂度分类器                  │
│  (小模型,低成本,快速判断)           │
└─────────────────────────────────────┘

    ├─→ 简单查询 → 无检索,直接生成

    ├─→ 中等查询 → 单次检索 + 生成

    └─→ 复杂查询 → 多步迭代检索 + 推理

三级处理策略

复杂度策略资源消耗
简单直接使用 LLM 内置知识最低
中等单次检索增强中等
复杂多步迭代推理最高

分类器设计

分类器通常使用小型语言模型,基于标注数据训练:

python
class ComplexityClassifier:
    def __init__(self):
        self.model = load_small_model()  # 如 DistilBERT

    def classify(self, query):
        features = self.extract_features(query)
        # 特征包括:查询长度、实体数量、关系复杂度等
        return self.model.predict(features)
        # 返回:'simple', 'moderate', 'complex'

核心优势

  • 资源效率:简单查询快速处理,复杂查询深入分析
  • 成本优化:避免不必要的检索操作
  • 响应优化:简单问题快速响应,复杂问题充分推理

适用场景

  • 查询复杂度差异大的应用
  • 成本敏感的生产环境
  • 需要平衡速度与质量的系统

六、图增强 RAG(Graph-Based RAG)

图增强 RAG 将知识图谱与文档检索结合,增强关系推理和多跳问答能力。

Agent-G 框架

Agent-G图 6:Agent-G 框架架构

Agent-G 整合图知识库和非结构化文档检索:

用户查询

    ├─→ 图检索器 → 实体关系

    └─→ 文档检索器 → 上下文信息


┌─────────────────────────────────────┐
│           批评模块                   │
│   验证数据相关性和质量               │
│   低置信度 → 触发重新检索            │
└─────────────────────────────────────┘


LLM 整合 → 最终响应

GeAR 框架

GeAR图 7:GeAR 框架概览

GeAR 通过图扩展增强传统检索:

  • 图扩展模块:将图结构数据整合到检索过程
  • 智能体检索:自主选择和组合检索策略
  • 多跳支持:处理需要跨多个信息节点的复杂查询

核心优势

  • 增强推理:结合结构化关系与上下文信息
  • 动态适应:根据查询需求调整检索策略
  • 高准确性:通过批评模块验证数据质量

适用场景

  • 知识图谱应用
  • 需要实体关系推理的问答
  • 科研文献分析(引用关系、作者网络)

七、Agentic 文档工作流(ADW)

Agentic 文档工作流将传统 RAG 扩展为端到端文档处理自动化,实现从文档解析到结构化输出的完整流程。

文档工作流图 8:Agentic 文档工作流

工作流程

原始文档


┌─────────────────────────────────────┐
│           文档解析                   │
│   提取字段、识别结构                 │
└─────────────────────────────────────┘


┌─────────────────────────────────────┐
│           状态维护                   │
│   跨处理阶段跟踪文档上下文           │
└─────────────────────────────────────┘


┌─────────────────────────────────────┐
│           知识检索                   │
│   访问外部知识库和领域规则           │
└─────────────────────────────────────┘


┌─────────────────────────────────────┐
│           智能编排                   │
│   应用业务规则、多跳推理             │
└─────────────────────────────────────┘


结构化输出(报告、决策、操作建议)

核心特征

特征说明
状态维护跨处理阶段保持文档上下文一致性
多步编排协调多组件完成复杂工作流
领域智能应用特定业务规则和合规要求
可扩展性支持大规模文档处理

典型应用:发票处理

发票文档


解析:提取供应商、金额、日期、项目明细


检索:获取供应商合同、折扣条款


推理:应用折扣规则、合规检查


输出:付款建议、预算影响分析

适用场景

  • 企业文档自动化处理
  • 合同审查和管理
  • 财务报表分析
  • 合规文档审核

架构选择决策树

                    你的应用需求是什么?

              ┌────────────┼────────────┐
              ↓            ↓            ↓
          简单问答     复杂推理      文档处理
              │            │            │
              ↓            ↓            ↓
         单智能体      多数据源?    端到端自动化
              │            │            │
              │       ┌────┴────┐       │
              │       ↓         ↓       │
              │   需要纠错?  知识图谱?   │
              │       │         │       │
              │       ↓         ↓       │
              │   纠正式RAG  图增强RAG   │
              │                         │
              └────────────┬────────────┘

                     需要层级控制?

                    ┌──────┴──────┐
                    ↓             ↓
               层级架构      多智能体

思考题

  1. 如何决定使用单智能体还是多智能体架构?关键考量因素是什么?
  2. 纠正式 RAG 和自适应 RAG 可以结合使用吗?如何设计?
  3. 在实现层级架构时,如何避免信息传递过程中的损失?

基于 MIT 许可证发布。内容版权归作者所有。