Oct, 2024

Long²RAG:评估长文档和长背景检索增强生成的关键点回想

TL;DR本研究针对当前检索增强生成(RAG)系统在长背景处理和长文本生成评估中的不足,提出了Long²RAG基准和关键点回想(KPR)指标。研究的主要发现表明,新基准和指标能够有效衡量大型语言模型在生成过程中如何利用检索信息,提高了评估的全面性与精准度。