EMNLPNov, 2022

用于事实验证的数据高效自回归文档检索

TL;DR本文介绍了一种不需要标注的远程监督方法,可用于训练自回归召回器,以在零样本环境中获得竞争性召回率和精确率。此外,通过针对特定任务的监督微调,展示了利用少于 1/4 注释数据的情况下,基于 Wikipedia 的事实验证任务的自回归检索性能可以接近甚至超过全监督。这指出数据有效的自回归检索存在着可行的方向。