ACLApr, 2020

MixText: 语言知识驱动的隐藏空间插值半监督文本分类

TL;DR提出了 MixText,这是一种用于文本分类的半监督学习方法,利用我们新设计的数据增强方法 TMix,在隐藏空间插值文本来创建大量的增强训练样本。混合标记的、未标记的和增强的数据,MixText 在几个文本分类基准测试中显著优于当前的预训练和微调模型以及其他最先进的半监督学习方法,尤其是在监督极度有限的情况下。我们已经在此 https URL 上公开发布了我们的代码。