EMNLPOct, 2022

基于 Transformer 自编码器的有效预训练目标

TL;DR本研究研究了使用不同的预训练目标预训练 Transformer 编码器时,效率、成本和准确性之间的权衡,并分析了常见目标的特征并将它们组合起来创建新的有效预训练方法。该实验使用基于直观统计方法的轻型标记生成器替换 ELECTRA 计算重的生成器,从而大大降低成本,并表明 (i) 比 BERT 的 MLM 更高效的替代方案存在,(ii) 可以使用更轻的生成器高效地预训练基于 Transformer 的模型,而不会显著降低性能。