Nov, 2011
基于贝叶斯非参数的k-means聚类新算法再探
Revisiting k-means: New Algorithms via Bayesian Nonparametrics
TL;DR本文从贝叶斯非参数的角度出发,重新审视了k-means聚类算法。通过分析Dirichlet过程混合物的Gibbs抽样算法,我们发现这个算法在极限下接近于硬聚类算法,可以优雅且单调地最小化一个类似k-means的聚类目标,包括对聚类数的惩罚。我们将这个方法推广到了多个数据集的聚类情况,并讨论了进一步的扩展,包括门槛特征向量的光谱松弛和在图中不需要固定聚类数的归一化割图聚类算法。