May, 2024

FlashBack: 长文本推理的高效检索增强语言建模

TL;DR通过将外部语料库的相关文档与大型语言模型(LLM)集成,检索增强语言建模(RALM)是一种已被证明的方法,可以让 LLM 生成超出其预训练语料库范围的信息。本文提出了 FlashBack,一种模块化的 RALM,通过在上下文末尾附加检索到的文档来提高 RALM 的推理效率,同时在特定的微调后保持良好的性能,而不会严重破坏 LLM 的知识完整性。