ACLMay, 2022

基于数据制图的预训练语言模型 MixUp 技术

TL;DR本文提出 TDMixUp 方法,利用训练动态,基于易于学习或模糊样本测量置信度、可变性、AUM 特征,让更具备信息量的样本相互插值,生成新样本,实验证明该方法不仅在较小的训练数据子集上取得竞争性能,而且在广泛的自然语言处理任务中,使用预训练语言模型 BERT 取得较低的期望校准误差。我们公开发布了我们的代码。