EMNLPNov, 2023

RankAug: 文本分类的增强数据排名

TL;DR本研究提出了一种名为 RankAug 的文本排名方法,通过多样性的词汇和句法,检测和过滤出最具相似意义的顶级增强文本,从而改善生成数据过滤在自然语言理解任务中的性能,特别是意图和情感分类。通过对多个数据集进行实验,我们证明了过滤技术的精心选择可以显著提高少数派分类的准确性,提高了多达 35%。