Mar, 2022
基于 Bag 采样和分组损失的文档排序中的标签噪声信息检索
Information retrieval for label noise document ranking by bag sampling and group-wise loss
Chunyu Li, Jiajia Ding, Xing hu, Fan Wang
TL;DR该研究提出了预训练模型、包采样和基于组的本地对比评估(LCE)方法以消除长文档排序中的噪音、数据标签噪音、负数据不平衡采样等问题。在 MS MARCO 长文档排名榜上表现出了良好的性能。