StructuredRAG: JSON Response...

  • AMiner学术头条
  • 2024-08-30 09:22:22
StructuredRAG: JSON Response Formatting with Large Language Models网页链接
本文介绍了StructuredRAG,一个用于评估大型语言模型(LLM)遵循响应格式指令能力的六个任务基准。研究了两项最先进的LLM,Gemini 1.5 Pro和Llama 3 8B-instruct,并采用两种不同的提示策略进行评估,分别是f-String和Follow the Format (FF)提示。通过24个实验发现,平均成功率为82.55%,性能在任务、模型和提示策略之间存在高方差,成功率介于0到100%。研究还发现,任务复杂性对性能有显著影响,列表或复合对象输出的任务更具挑战性。研究结果强调了进一步研究改进LLM中结构化输出生成的可靠性和一致性的需要。实验代码和结果已在github.com/weaviate/structured-rag开源。
考博人工智能论文写作大模型
StructuredRAG: JSON Response...