Mar, 2022

基于 Bag 采样和分组损失的文档排序中的标签噪声信息检索

TL;DR该研究提出了预训练模型、包采样和基于组的本地对比评估(LCE)方法以消除长文档排序中的噪音、数据标签噪音、负数据不平衡采样等问题。在 MS MARCO 长文档排名榜上表现出了良好的性能。