AAAISep, 2023

低资源语言的分布式数据增强方法

TL;DR通过提出易分布数据增强(EDDA)和类型特定的相似词替换(TSSR)两种扩展方法,利用语义词上下文信息和词性标签进行词替换和增强,我们展示了这些方法在低资源语言的两个代表数据集上通过 F1 分数度量的实用性,证明了增强数据可以在低资源环境中提高分类性能。