ACLMay, 2018

具境语境的数据增强:使用词形关系进行数据增强

TL;DR本文介绍了一种新的数据增强技术 —— 上下文增强,使用双向语言模型预测单词位置上各个单词,将其替换为预测出的单词增强原句子,同时使用带标签的模型改进以确保模型增强句子不破坏标签状态,并在六种不同的文本分类任务中实验证明该方法可以改善基于卷积或循环神经网络的分类器。