Sep, 2021

简单却令人沮丧的预训练替代方法: 掩码语言建模

TL;DR本文研究了五种基于令牌级分类任务的简单预训练目标作为MLM替代品,证明这些方法可以达到与使用BERT-BASE结构的MLM相当或更好的性能,并且使用较小的模型进行验证。