ICLRSep, 2019

Mixout:一种有效的正则化方法,用于微调大规模预训练语言模型

TL;DR本文提出了一种新的正则化技术,名为 “mixout”,并在预训练语言模型上的下游任务中展示了其稳定性和准确性的提高。