TL;DR本文提出了稀疏主题编码(STC)方法,通过使用稀疏性建模大数据集的潜在表示,可以直接控制推断表示的稀疏性,并且可以与凸误差函数(例如 SVM Hinge Loss)无缝集成进行监督学习。实验结果表明,STC 和监督 MedSTC 模型在词汇的主题意义识别和分类准确性和时间效率方面优于其他模型。
Abstract
We present sparse topical coding (STC), a non-probabilistic formulation of
topic models for discovering latent representations of large collections of
data. Unlike probabilistic topic models, STC relaxes the norm