Jan, 2023

从头开始预训练变形金刚模型,用于信息检索的实验研究

TL;DR本文研究预训练语言模型(PLM)对信息检索有效性的影响,挑战了当前假设 PLM 应该在足够大的基础集合上进行训练的想法,并表明从感兴趣的集合开始预训练与当前方法相比具有令人惊讶的竞争力。作者对一些任务进行了性能基准测试,发现模型预训练只在目标集合上的效果略微下降。研究结论指出从头开始进行预训练能够更好地控制效率,数据偏差和可重复性,并促进了建立专业化模型的想法。