EMNLPAug, 2021
AEDA: 文本分类更易用的数据增强技术
AEDA: An Easier Data Augmentation Technique for Text Classification
Akbar Karimi, Leonardo Rossi, Andrea Prati
TL;DR本文提出了一种名为 AEDA 的数据增强技术,通过在原始文本中随机插入标点符号来改善文本分类任务的性能,相比于 EDA 方法,AEDA 更易于实现,而且在句子中改变单词位置时保留词序,从而导致更好的泛化性能。实验结果表明,在使用 AEDA 增强数据训练的情况下,该模型在五个数据集中表现出优异的性能。