Apr, 2014

来自一系列负二项式过程的随机计数矩阵的先验

TL;DR定义了一组概率分布,用于随机计数矩阵,并构建出三种分布,分别来自于 gamma-Poisson、gamma-negative binomial 和 beta-negative binomial 过程。这些模型都具有 GIBBS 抽样更新方程,适合作为计数矩阵的非参数贝叶斯先验。通过对这些矩阵的组合结构进行分析,介绍了如何逐行构建一个列独立同分布的计数矩阵,并得到了新行计数向量的预测分布。最后,用这些先验设计了一个朴素贝叶斯文本分类器,并通过实验证明了负二项式过程比 Poisson 过程更适合文本分类。