Oct, 2015

大维数据的核谱聚类

TL;DR本文通过对核谱聚类方法进行首次分析,发现在维度和数量同时增长的情况下,核矩阵的归一化拉普拉斯矩阵与所谓的尖峰随机矩阵呈类似的渐近行为。通过一种如尖峰矩阵模型的可分离条件,证明该模型中的一些孤立特征值 - 特征向量对携带聚类信息。我们精确评估了这些特征值的位置和特征向量内容,在理论和实践角度揭示了核谱聚类中非常重要(有时相当破坏性)的方面。最后将结果与 MNIST 数据库中图像实际聚类的性能进行比较,证明了理论和实践之间的重要匹配。