ICLRJul, 2023

S2vNTM: 半监督 vMF 神经主题建模

TL;DR本文提出了半监督 vMF 神经主题建模(S2vNTM)方法,该方法通过少量种子关键字作为主题输入,利用关键字的模式识别潜在主题,并优化主题的关键字集,旨在克服现有的一些困难,包括难以整合人类知识,需要大量资源来训练模型以及依赖大量文本数据进行预训练,实验表明,S2vNTM 在提供有限关键字的情况下,在多个数据集上的分类准确性均优于现有的半监督主题建模方法,并且至少比基线快一倍。