AAAIMay, 2023

低资源环境下对抗性词汇稀释作为文本数据增强

TL;DR本研究提出了一种 Adversarial Word Dilution(AWD) 文本数据增强方法,通过将强阳性单词的嵌入与未知单词的嵌入进行加权混合,生成难以被分类模型识别为阳性的文本输入,以有效训练低资源文本分类模型。实验表明,AWD 可以生成更有效的数据增强,并且是可解释的,可以灵活扩展到新的示例而无需进一步训练。