ACLApr, 2022

EPiDA:一个易于插件化的数据增强框架,用于高性能文本分类

TL;DR本文提出了一种易于使用的、支持有效文本分类的数据增强框架 EPiDA,它利用相对熵极大化和条件熵最小化来控制数据生成,其中相对熵用于增强数据的多样性,而条件熵则用于确保其语义一致性。实验结果表明,EPiDA 在大多数情况下优于现有的最先进方法,并且适用于各种数据增强算法和分类模型。