EMNLPAug, 2021

AEDA: 文本分类更易用的数据增强技术

TL;DR本文提出了一种名为 AEDA 的数据增强技术,通过在原始文本中随机插入标点符号来改善文本分类任务的性能,相比于 EDA 方法,AEDA 更易于实现,而且在句子中改变单词位置时保留词序,从而导致更好的泛化性能。实验结果表明,在使用 AEDA 增强数据训练的情况下,该模型在五个数据集中表现出优异的性能。