Apr, 2024

STaRK: 在文本和关系知识库上评估 LLM 检索的基准

TL;DR回答真实世界中的用户查询,如产品搜索,通常需要从半结构化知识库或涉及混合结构化和非结构化信息的数据库中准确检索信息。我们开发了 STARK,一个基于文本和关系知识库的大规模半结构化检索基准,以填补此间隙,并验证了此基准的质量和实际应用的多样性。我们的实验表明,STARK 数据集对当前的检索系统和大型语言模型系统提出了显着挑战,表明需要构建更具能力的检索系统来处理文本和关系方面的要求。