LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)

  • 爱可可-爱生活
  • 2024-12-22 09:40:41
【LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)】'lechmazur/confabulations: Hallucinations (Confabulations) Document-Based Benchmark for RAG' GitHub: github.com/lechmazur/confabulations AI评估 大型语言模型 幻觉识别 AI创造营
LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)