Oct, 2022
强化器还是滤镜?重新思考预训练语言模型在文本分类增强中的作用
Augmentor or Filter? Reconsider the Role of Pre-trained Language Model
in Text Classification Augmentation
TL;DR本研究提出BOOSTAUG,这个基于预训练语言模型的文本增强方法重点在于增强实例过滤,而不是生成,解决现有文本增强方法中的性能下降和特征空间漂移等问题。结果表明,在句子级文本分类和基于方面的情感分类上,BOOSTAUG均取得了最先进的性能,该方法是灵活的,可以改进现有的增强方法。