Mar, 2024

RAGGED: 面向具备信息的检索增强生成系统的设计

TL;DR检索增强生成(RAG)通过为文档问答等任务提供额外的上下文大大提升了语言模型(LMs)的能力。在研究框架RAGGED下,我们研究了代表性的文档问答任务,观察了两种经典的稀疏和密集检索器以及四种在编码器-解码器和仅解码器架构中表现优异的LMs。研究结果显示,不同的模型适用于不同的RAG配置,而编码器-解码器模型在使用更多文档时呈现出单调改进,而仅解码器模型只能有效使用小于5个文档,尽管其上下文窗口通常更长。此外,RAGGED还揭示了LMs的上下文利用习惯,其中编码器-解码器模型更依赖上下文,并且对于检索质量更为敏感,而仅解码器模型则更倾向于依赖训练中记忆的知识。