Jan, 2024

迭代掩码填充:一种使用掩码语言建模的有效文本增强方法

TL;DR我们提出了一种利用基于变压器的 BERT 模型的填充掩码特性的新型文本增强方法,该方法在句子中迭代遮盖单词并使用语言模型预测替换它们。我们在各种 NLP 任务上测试了我们提出的方法,并发现它在许多情况下都是有效的。我们将我们的结果与现有的增强方法进行了比较,并实验结果表明我们提出的方法显著提高了性能,尤其是在主题分类数据集上。