Mar, 2023

台风:面向预训练语言模型的有效任务特定遮盖策略

TL;DR本文探索了一种任务特定的掩蔽框架,用于预先训练的大型语言模型,在 GLUE 基准测试的数据集上实现了卓越的性能,我们基于令牌输入梯度开发了我们自己的掩码算法 Typhoon,并将其与其他标准基线进行了比较。我们发现 Typhoon 在 MRPC 数据集上的表现与整词掩蔽相当。