Jun, 2024

LongRAG: 增强检索增强生成的长文本语言模型

TL;DR在传统的 RAG 框架中,检索单元通常很短,而我们提出的 LongRAG 框架则将整个维基百科以 4K-token 为单位处理,通过增加单元大小和减少总单元数量,降低了检索器的负担,并在没有任何训练的情况下实现了最佳结果,这为将 RAG 与长文本语言模型相结合的未来发展提供了启示。