AI概念解析图大汇总

  • 量子位
  • 2025-05-21 12:56:36
AI概念解析图大汇总九张图详解重要AI概念

技术的快速发展,许多有关AI的概念也不断涌现。

MCP、RAG、Agentic AI……这九张图或许能帮助你更好的理解这些复杂的名词。

建议收藏起来慢慢看~

1. 模型上下文协议 (Model Context Protocol)【图1】

MCP如同AI应用的USB-C接口,MCP为AI应用与数据源及工具建立了标准化连接。核心采用客户端-服务器架构,支持宿主应用程序连接多个服务器。
关键组件包含:
- 宿主程序(Host)
- 客户端(Client)
- 服务器端(Server)

2. Transformer与Moe的差别【图2】

混合专家(Mixture of Experts,MoE)是一种流行的架构,它通过不同的“专家”模块来提升Transformer模型的性能。

Transformer与MoE的差异主要集中在解码器模块,Transformer采用标准的全连接前馈网络,MoE使用多个专家模块,规模较Transformer的前馈网络更小

3. KV缓存【图3】

KV缓存(键值缓存)是一种用于加速大语言模型推理的技术。该技术通过缓存所有上下文标记的KV向量,避免冗余计算。具体生成标记的流程如下:

- 动态计算:为前一步生成的标记计算其QKV向量
- 缓存复用:从缓存中获取所有其他标记的KV向量
- 注意力计算:完成最终的注意力运算

4. 5种微调LLM的技巧【图4】
LoRA:只训练小型矩阵(低秩矩阵)来调整模型行为,不动原始参数。
LoRA-FA:结合LoRA和AdaFactor优化器,通过AdaFactor的特性来减少内存占用和计算量。
VeRA:所有微调模块共享同一组随机初始化的权重,仅通过少量可训练参数区分不同模块。
Delta-LoRA:不仅训练低秩矩阵,还会反向传播少量误差到原模型参数。
LoRA+:引入动态秩调整机制,根据任务复杂度自动决定低秩矩阵的大小。

5. RAG与智能体RAG【图5】

传统RAG存在诸多局限性,如:单次检索单次生成、缺乏复杂推理能力、处理方式固定。智能体RAG通过在每个处理阶段引入智能体解决这些局限性。

6. 5种流行的Agentic AI设计模式【图6】

- 反思模式(Reflection Pattern):AI像“自我审查员”一样反复检查输出,通过多轮迭代修正错误,直到结果完善。
- 工具调用模式(Tool Use Pattern):将大模型视为"大脑",外部工具作为"双手",通过API、数据库等实现精准操作。
- 推理-行动模式(ReAct):融合反思与工具调用,形成"思考-行动-验证"的智能闭环,当前最先进的代理架构之一。
- 任务规划模式(Planning Pattern):像专业项目经理般拆解复杂任务,制定分步执行策略,确保系统性解决问题。
- 多智能体协作模式(Multi-Agent Pattern):各领域专家代理组成虚拟团队,通过分工协作攻克单一代理难以完成的复杂挑战。

7. 传统RAG与HyDE【图7】

传统RAG问题与答案在语义上并不相似,系统可能检索到无关上下文。

HyDE方案首先为查询Q生成查询的假设性答案H,再将假设答案H转化为嵌入向量E,用嵌入向量E在向量数据库中查询,获取相关性最高的上下文C,将检索到的上下文C与原始查询Q共同输入LLM生成最终答案。

8. RAG与图式RAG【图8】

当处理需要全局语义关联的复杂查询时,传统RAG基于top-k相似片段的检索机制难以捕捉跨文档的深层关联。通过引入图结构,图式RAG显著提升了RAG架构的鲁棒性。

9. MCP与A2A技术对比【图9】
智能体应用需要同时集成A2A和MCP两大技术:
- MCP:为智能体提供工具调用能力
- A2A:实现智能体间的互联协作,支持团队化运作
AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总AI概念解析图大汇总