清华和面壁智能提出了RAG新方法...
- AIGCLINK
- 2024-10-25 16:54:54
清华和面壁智能提出了RAG新方法,开源了一个基于视觉语言模型的RAG方法:VisRAG,专用于处理多模态文档
与传统相比,VisRAG是直接将文档作为图像嵌入到VLM中,这样能最大限度保留和利用原始文档中的信息,避免解析过程中信息损失
结果是其端到端性能比传统RAG提高25-39%,在检索和生成阶段优于传统基于文本的RAG
github:RAG
与传统相比,VisRAG是直接将文档作为图像嵌入到VLM中,这样能最大限度保留和利用原始文档中的信息,避免解析过程中信息损失
结果是其端到端性能比传统RAG提高25-39%,在检索和生成阶段优于传统基于文本的RAG
github:RAG