Sep, 2020

开放领域问答的增强生成检索

TL;DR本文提出了一种 Generation-Augmented Retrieval 方法来回答开放领域的问题,这种方法通过发现相关语境并进行文本生成来增强查询,同时证明所生成的语境大大丰富了查询的语义,使用 BM25 稀疏表示与 DPU 等最先进的稠密检索方法相比,GAR 能够获得同等甚至更好的检索效果。本文还将 G.A.R. 与 DPU 相结合,能够在 Natural Questions 和 TriviaQA 数据集上显着提高提取式 QA 基线的性能,并且在使用相同的生成性阅读器时,GAR 频繁地优于其他检索算法。