Sep, 2023
生成查询和文档扩展何时失败?跨方法、检索器和数据集的综合研究
When do Generative Query and Document Expansions Fail? A Comprehensive
Study Across Methods, Retrievers, and Datasets
TL;DR使用大型语言模型进行查询或文档扩展可以提高信息检索的泛化能力,但是否普遍有益或仅在特定环境下有效仍不清楚。本研究通过第一次全面分析基于语言模型的扩展,发现存在查找模型表现与扩展收益之间的强负相关性。我们的结果建议:对于较弱的模型或目标数据集与训练语料库在格式上存在显著差异的情况下,使用扩展;否则,避免扩展以保持相关性信号清晰。