Mar, 2024

构建稳健的基于检索的摘要系统

TL;DR对大型语言模型(LLMs)在检索增强生成(RAG)式摘要任务中的鲁棒性进行了研究,提出了一种创新的评估框架 LogicSumm,通过现实场景评估 LLMs 在复杂的真实场景下的性能,并基于 LogicSumm 的限制提出了 SummRAG 系统,通过训练对话和模型微调来提高鲁棒性,实验证实了 SummRAG 的能力,展示了逻辑连贯性和摘要质量的提升。