Jan, 2024

多跳 - RAG: 用于多跳查询的检索增强生成的基准测试

TL;DR我们开发了一个新的数据集 MultiHop-RAG,它由知识库、大量的多跳查询、它们的真实答案和相应的支持证据组成,并详细介绍了构建数据集的过程。我们进行了两个实验来展示 MultiHop-RAG 的基准化效用,实验结果表明现有的 RAG 方法在检索和回答多跳查询上表现不尽人意。我们希望 MultiHop-RAG 能成为开发有效的 RAG 系统的有价值资源,从而促进 LLMs 在实践中的更广泛应用。