Aug, 2020

开放领域问答数据集中的问题与回答测试训练重叠

TL;DR本文研究开放领域问答模型的能力,发现许多测试集答案和训练集中的答案重复,只有部分问题可以从训练集中得到近似的问题,最终发现简单的最邻近模型表现比BART模型更好,证明训练集记忆在问答领域中发挥了重要作用。