WSDMNov, 2021

MotifClass: 基于高阶元信息的弱监督文本分类

TL;DR本文探究了利用异构信息网络的 metadata 和 motif 来帮助弱监督文本分类,提出了一种名为 MotifClass 的新框架来选择标志类别 motif 实例,基于类别名称和标志类别 motif 实例检索并生成伪标记训练样本,使用伪训练数据训练文本分类器,并通过对真实世界数据集的广泛实验证明了 MotifClass 相对于现有弱监督文本分类方法的卓越性能和考虑高阶元数据信息在我们的框架中的好处。