清华和面壁智能提出了RAG新方法...

AIGCLINK
2024-10-25 16:54:54

清华和面壁智能提出了RAG新方法，开源了一个基于视觉语言模型的RAG方法：VisRAG，专用于处理多模态文档

与传统相比，VisRAG是直接将文档作为图像嵌入到VLM中，这样能最大限度保留和利用原始文档中的信息，避免解析过程中信息损失

结果是其端到端性能比传统RAG提高25-39%，在检索和生成阶段优于传统基于文本的RAG

github：RAG