Large Language Models...
- AMiner学术头条
- 2024-08-30 00:36:45
Large Language Models As Foundations for Next-Gen Dense Retrieval: A Comprehensive Empirical Assessment
网页链接
这篇论文全面实证评估了大型语言模型在下一代密集检索中的作用。预训练的语言模型如BERT和T5是密集检索的关键骨架编码器,但这些模型通常表现出有限的泛化能力,并且面临提高领域准确性的挑战。最近的研究探索了使用大型语言模型(LLM)作为检索器,在各种任务上取得了最新的最佳性能。尽管这些进展显著,但LLM与传统检索器的具体好处以及不同的LLM配置(如参数大小、预训练持续时间和对齐过程)对检索任务的影响仍然不清楚。在这项工作中,我们在一系列检索任务上进行了全面的实证研究,包括领域准确性、数据效率、零样本泛化、长检索、基于指令的检索和多任务学习。我们评估了超过15个不同的骨架LLM和非LLM。研究发现,更大的模型和广泛的预训练一致地提高了领域准确性和数据效率。此外,更大型的模型在零样本泛化、长检索、基于指令的检索和多任务学习方面显示出巨大的潜力。这些结果突显了LLM作为通用且有效的密集检索骨架编码器的优势,为未来该领域的研究和发展提供了宝贵的见解。
考博
人工智能
论文写作
大模型

这篇论文全面实证评估了大型语言模型在下一代密集检索中的作用。预训练的语言模型如BERT和T5是密集检索的关键骨架编码器,但这些模型通常表现出有限的泛化能力,并且面临提高领域准确性的挑战。最近的研究探索了使用大型语言模型(LLM)作为检索器,在各种任务上取得了最新的最佳性能。尽管这些进展显著,但LLM与传统检索器的具体好处以及不同的LLM配置(如参数大小、预训练持续时间和对齐过程)对检索任务的影响仍然不清楚。在这项工作中,我们在一系列检索任务上进行了全面的实证研究,包括领域准确性、数据效率、零样本泛化、长检索、基于指令的检索和多任务学习。我们评估了超过15个不同的骨架LLM和非LLM。研究发现,更大的模型和广泛的预训练一致地提高了领域准确性和数据效率。此外,更大型的模型在零样本泛化、长检索、基于指令的检索和多任务学习方面显示出巨大的潜力。这些结果突显了LLM作为通用且有效的密集检索骨架编码器的优势,为未来该领域的研究和发展提供了宝贵的见解。



