【LLM Confabulation Benchmark:大型语言模型在面对基于文档的误导性问题时,如何减少产生不存在答案(幻觉或虚构)的能力评估工具,特别关注于检索增强型生成模型(RAG)】'lechmazur/confabulations: Hallucinations (Confabulations) Document-Based Benchmark for RAG' GitHub: github.com/lechmazur/confabulations
AI评估 大型语言模型 幻觉识别 AI创造营