Dec, 2021

GPL: 密集检索的生成伪标签用于无监督域适应

TL;DR该研究论文提出了一种新的无监督领域适应方法Generative Pseudo Labeling,该方法结合查询生成器和交叉编码器的伪标记,证明该方法可以在数据集较小的目标领域中进行更加鲁棒的训练,并且在检索任务上比最先进的密集检索方法提高了近9.3个百分点的nDCG@10指标。