Oct, 2016

几何狄利克雷均值算法用于主题推断

TL;DR本文介绍了一种几何算法,可将潜在狄利克雷分配(LDA)模型及其非参数扩展中产生的主题的凸几何用于主题学习和推断,并提出了一种优化几何损失函数的方法,它是 LDA 的似然函数的替代方法。该方法通过基于加权聚类的快速优化过程并辅以几何校正来克服其他基于 Gibbs 采样和变分推断的技术所遇到的计算和统计效率低下的问题,同时具有与 Gibbs 采样相当的准确性。通过模拟和实际数据的大量实验,证明了我们方法产生的主题估计在某些条件下是统计一致的。