ACLApr, 2020

双向对抗训练的神经主题建模

TL;DR提出了一种用于文本中的主题抽取的神经主题建模方法,Bidirectional Adversarial Topic (BAT) 模型,该模型使用双向对抗训练构建文档 - 主题分布和文档 - 单词分布之间的两向投影,并扩展了 Gaussian-BAT 模型用以提高相关单词信息的综合利用。在三个基准数据集上进行的实验结果表明,BAT 和 Gaussian-BAT 能够获得更一致的主题,提升了文本聚类的准确性。