LLM Confabulation Benchmark：大型语言模型在面对基于文档的误导性问题时，如何减少产生不存在答案（幻觉或虚构）的能力评估工具，特别关注于检索增强型生成模型（RAG）

爱可可-爱生活
2024-12-22 09:40:41

【LLM Confabulation Benchmark：大型语言模型在面对基于文档的误导性问题时，如何减少产生不存在答案（幻觉或虚构）的能力评估工具，特别关注于检索增强型生成模型（RAG）】'lechmazur/confabulations: Hallucinations (Confabulations) Document-Based Benchmark for RAG' GitHub: github.com/lechmazur/confabulations AI评估大型语言模型幻觉识别 AI创造营