May, 2018

具有最小最大保证的快速算法用于未知主题数量的主题模型

TL;DR我们提出了一种新的主题模型估计方法,可以从观察到的数据中估计出主题数量 K,并在任意文档数量、单个文档长度、字典大小和主题数量的情况下实现了最小极小值下限和最新的上限估计。同时,在模拟研究中我们展示了这种新算法比现有的算法更快更准确。