May, 2024

xRAG:一令牌极其上下文压缩的检索增强生成

TL;DRxRAG 是一种针对检索增强生成的创新上下文压缩方法,通过模态融合的方法将文档嵌入重新解释为来自检索模态的特征,并在语言模型表示空间中无缝集成这些嵌入以实现极高的压缩率。实验证明,xRAG 在六个强调知识的任务中达到了平均改进 10% 以上,适用于各种语言模型主干结构,从密集 7B 模型到 8x7B 多专家结构。xRAG 不仅显著超越了以前的上下文压缩方法,而且在减少计算量(FLOPs)的同时,与未压缩模型在多个数据集上保持了相当的性能,为未来有效和可伸缩的检索增强系统奠定了基础。