EMNLPSep, 2021

R2-D2:开放领域问答的模块化基线

TL;DRR2-D2 是一个四阶段的开放领域问答管道,由检索器、段落重新排名器、抽取读取器、生成读取器以及一个聚合所有系统组成部分的终极预测机制组成。我们在三个开放领域问答数据集上展示了其优势,并超越了前两个的最新成果。我们的分析表明:(i) 将抽取式和生成式读取器相结合可以产生达到 5 个精确匹配的绝对改进,其效果至少是使用不同参数的同一模型的后验平均集成的两倍。(ii) 在抽取式问答数据集上,具有更少参数的抽取式读取器可以与生成式读取器的表现相匹配。