AI概念解析图大汇总

量子位
2025-05-21 12:56:36

AI概念解析图大汇总九张图详解重要AI概念

技术的快速发展，许多有关AI的概念也不断涌现。

MCP、RAG、Agentic AI……这九张图或许能帮助你更好的理解这些复杂的名词。

建议收藏起来慢慢看～

1. 模型上下文协议 (Model Context Protocol)【图1】

MCP如同AI应用的USB-C接口，MCP为AI应用与数据源及工具建立了标准化连接。核心采用客户端-服务器架构，支持宿主应用程序连接多个服务器。
关键组件包含：
- 宿主程序（Host）
- 客户端（Client）
- 服务器端（Server）

2. Transformer与Moe的差别【图2】

混合专家（Mixture of Experts，MoE）是一种流行的架构，它通过不同的“专家”模块来提升Transformer模型的性能。

Transformer与MoE的差异主要集中在解码器模块，Transformer采用标准的全连接前馈网络，MoE使用多个专家模块，规模较Transformer的前馈网络更小

3. KV缓存【图3】

KV缓存（键值缓存）是一种用于加速大语言模型推理的技术。该技术通过缓存所有上下文标记的KV向量，避免冗余计算。具体生成标记的流程如下：

- 动态计算：为前一步生成的标记计算其QKV向量
- 缓存复用：从缓存中获取所有其他标记的KV向量
- 注意力计算：完成最终的注意力运算

4. 5种微调LLM的技巧【图4】
LoRA：只训练小型矩阵（低秩矩阵）来调整模型行为，不动原始参数。
LoRA-FA：结合LoRA和AdaFactor优化器，通过AdaFactor的特性来减少内存占用和计算量。
VeRA：所有微调模块共享同一组随机初始化的权重，仅通过少量可训练参数区分不同模块。
Delta-LoRA：不仅训练低秩矩阵，还会反向传播少量误差到原模型参数。
LoRA+：引入动态秩调整机制，根据任务复杂度自动决定低秩矩阵的大小。

5. RAG与智能体RAG【图5】

传统RAG存在诸多局限性，如：单次检索单次生成、缺乏复杂推理能力、处理方式固定。智能体RAG通过在每个处理阶段引入智能体解决这些局限性。

6. 5种流行的Agentic AI设计模式【图6】

- 反思模式（Reflection Pattern）：AI像“自我审查员”一样反复检查输出，通过多轮迭代修正错误，直到结果完善。
- 工具调用模式（Tool Use Pattern）：将大模型视为"大脑"，外部工具作为"双手"，通过API、数据库等实现精准操作。
- 推理-行动模式（ReAct）：融合反思与工具调用，形成"思考-行动-验证"的智能闭环，当前最先进的代理架构之一。
- 任务规划模式（Planning Pattern）：像专业项目经理般拆解复杂任务，制定分步执行策略，确保系统性解决问题。
- 多智能体协作模式（Multi-Agent Pattern）：各领域专家代理组成虚拟团队，通过分工协作攻克单一代理难以完成的复杂挑战。

7. 传统RAG与HyDE【图7】

传统RAG问题与答案在语义上并不相似，系统可能检索到无关上下文。

HyDE方案首先为查询Q生成查询的假设性答案H，再将假设答案H转化为嵌入向量E，用嵌入向量E在向量数据库中查询，获取相关性最高的上下文C，将检索到的上下文C与原始查询Q共同输入LLM生成最终答案。

8. RAG与图式RAG【图8】

当处理需要全局语义关联的复杂查询时，传统RAG基于top-k相似片段的检索机制难以捕捉跨文档的深层关联。通过引入图结构，图式RAG显著提升了RAG架构的鲁棒性。

9. MCP与A2A技术对比【图9】
智能体应用需要同时集成A2A和MCP两大技术：
- MCP：为智能体提供工具调用能力
- A2A：实现智能体间的互联协作，支持团队化运作