基于特征值的增量谱聚类
本文提出了一种基于图信号处理的方法,采用图滤波和随机采样技术加速生成 Laplacian 矩阵特征向量和 k-means 聚类算法步骤,该方法在控制误差的同时计算时间效率可达到数个数量级的提升,并在人工合成数据和真实网络数据集上进行测试。
Feb, 2016
本文研究了流行的谱聚类算法的一致性,并开发了新方法来证明谱聚类算法的一致性。结果表明,规范化聚类在非常普遍的条件下是一致的,而未规范化聚类只在强附加假设下是一致的。因此,规范化谱聚类算法是优越的。
Apr, 2008
本研究提出了一种基于顶点嵌入的简单谱聚类算法,通过幂法计算的向量,在接近线性时间内计算顶点嵌入,并在输入图形的自然假设下,算法能够可靠地恢复出真实聚类结果。通过在多个合成和现实世界数据集上的评估发现,该算法与其他聚类算法相比,具有显著更快的速度,并且产生的聚类准确度基本相同。
Oct, 2023
本研究针对典型的谱聚类算法,探讨在一些较弱条件下其性能为何,还研究了利用少于 k 个特征向量进行嵌入的谱聚类,实验表明在合成和真实数据上,使用少于 k 个特征向量时,谱聚类也能够产生相当或更好的结果。
Aug, 2022
本文通过对核谱聚类方法进行首次分析,发现在维度和数量同时增长的情况下,核矩阵的归一化拉普拉斯矩阵与所谓的尖峰随机矩阵呈类似的渐近行为。通过一种如尖峰矩阵模型的可分离条件,证明该模型中的一些孤立特征值 - 特征向量对携带聚类信息。我们精确评估了这些特征值的位置和特征向量内容,在理论和实践角度揭示了核谱聚类中非常重要(有时相当破坏性)的方面。最后将结果与 MNIST 数据库中图像实际聚类的性能进行比较,证明了理论和实践之间的重要匹配。
Oct, 2015
本文提出了一种基于相关性阈值和谱聚类算法的低复杂度聚类算法,可将高维数据点聚类成低维线性子空间的集合,并成功处理了子空间相交和数据点缺失的问题,同时还提出一种检测异常值的方案。
Mar, 2013