Jan, 2024

多跳-RAG: 用于多跳查询的检索增强生成的基准测试

TL;DR我们开发了一个新的数据集MultiHop-RAG,它由知识库、大量的多跳查询、它们的真实答案和相应的支持证据组成,并详细介绍了构建数据集的过程。我们进行了两个实验来展示MultiHop-RAG的基准化效用,实验结果表明现有的RAG方法在检索和回答多跳查询上表现不尽人意。我们希望MultiHop-RAG能成为开发有效的RAG系统的有价值资源,从而促进LLMs在实践中的更广泛应用。