EMNLPOct, 2020

预训练语言模型的胚胎学:ALBERT 的诞生

TL;DR研究预训练语言模型的 “胚胎学”,发现 ALBERT 在预训练过程中以不同的学习速度学习重建和预测不同词性的词元。另外,语言知识和世界知识并没有随着预训练的进行而普遍改善,下游任务的性能也没有提高。