May, 2023

掩码预训练目标的任务复杂度如何影响下游性能?

TL;DR本研究旨在探究更加复杂的目标掩码方案是否能够取得比Masked language modeling 更好的效果,并验证它们需要具备多少的复杂性才能够达到相似的性能;结果表明,相对于 Masked language modeling 来说,更加复杂的掩码方案能够在半数量级的复杂性下取得更好的效果,最后,我们还从任务复杂性的角度探讨了如何预训练模型。