May, 2014

Peacock: 针对工业应用学习长尾话题特征

TL;DR本文提出了一个新的分布式系统 Peacock,以学习大规模的 LDA 主题模型,可以从大规模数据集中推断出至少 10^5 个主题,对于工业搜索引擎和在线广告系统都有显著的提高。