Jan, 2021

子结构替换:面向 NLP 的结构化数据增强

TL;DR该研究探讨了一种基于数据增强的方法 SUB2,可以用于自然语言处理 (NLP) 任务,通过替换子结构生成新的样例,可以应用于许多结构化 NLP 任务,同时针对一般性的任务,该方法也可以通过基于句法解析树的变化引入结构感知型数据增强方法,大部分情况下,SUB2 通过增强数据集的训练可以获得比使用原始数据集更好的性能,并且在不同类型的任务和种子数据集大小方面,SUB2 相比其他方法具有更加一致的性能。