EMNLPDec, 2022

FastClass:一种高效的弱监督文本分类方法

TL;DR本文提出了一种有效的弱监督分类方法 FastClass,它使用密集文本表示从外部无标签语料库中检索与类相关的文档,并选择最优子集来训练分类器,相比关键词驱动方法,我们的方法对初始类描述的依赖性更低且训练速度更快,实验证明在广泛的分类任务上,该方法的分类准确性通常优于关键词驱动模型并且训练速度对比关键词驱动方法快得多。