SIGIRSep, 2023

为神经排序模型微调标注数据?当前主动学习策略不如随机选择

TL;DR本文研究了在有限的训练数据和预算下微调基于预训练语言模型的排序器,发现随机选择不同子集的训练数据进行微调时产生的有效性存在巨大的变化,并探究了主动学习策略在降低标注成本方面的有效性