EMNLPApr, 2021

遮蔽语言建模和分布假设:有序词预训练对小型模型的影响

TL;DR本文提出了一个新的解释:遮蔽语言模型 (MLM) 成功地解决了下游任务几乎完全归功于其建模更高阶词共现统计量的能力。