压缩谱聚类
本文提出了一种基于图信号处理的快速谱聚类算法,通过使用图滤波器对随机信号进行谱聚类距离矩阵的估计,利用这些随机向量的随机性来估计聚类数目 k,相较于传统谱聚类方法,我们的方法在大规模数据集上表现相当且速度至少快二倍。
Sep, 2015
本研究提出了一种基于顶点嵌入的简单谱聚类算法,通过幂法计算的向量,在接近线性时间内计算顶点嵌入,并在输入图形的自然假设下,算法能够可靠地恢复出真实聚类结果。通过在多个合成和现实世界数据集上的评估发现,该算法与其他聚类算法相比,具有显著更快的速度,并且产生的聚类准确度基本相同。
Oct, 2023
本文提出了一种改进的光谱聚类算法,旨在解决预定义的相似性图可能不是合适的聚类结果,并且传统离散化解决方法与光谱解决方案可能不一致的问题,并引入多核学习来解决如何选择最适合特定数据集的核的应用挑战。实验结果表明,该方法相比于现有的聚类方法具有更好的性能。
Nov, 2017
本研究针对典型的谱聚类算法,探讨在一些较弱条件下其性能为何,还研究了利用少于 k 个特征向量进行嵌入的谱聚类,实验表明在合成和真实数据上,使用少于 k 个特征向量时,谱聚类也能够产生相当或更好的结果。
Aug, 2022
本文研究了基于 CPU-GPU 异构平台实现的高效谱聚类算法。通过对高维空间中的数据点进行并行处理,建立标准的稀疏相似性图并计算拉普拉斯矩阵的最小 $k$ 个特征向量,同时在 GPU 上实现了快速的 $k$ 均值聚类算法。实验结果表明,该算法比 Matlab 和 Python 的最佳实现方法快得多,并且可以扩展到具有大量聚类的问题。
Feb, 2018
使用随机分箱特征(RB)的新型可扩展谱聚类方法,通过内积计算大型稀疏特征矩阵来近似图相似性(核)矩阵,然后使用最先进的奇异值分解(SVD)求解器有效地计算此大型矩阵的特征向量,从而将计算成本从二次降至线性,同时实现类似的精度和更快的收敛。
May, 2018
基于子集集合的归一化特征值谱,我们提出了一种增量谱聚类方法,将数据分成可管理的子集,对每个子集进行聚类,根据特征值谱的相似性合并不同子集的聚类结果,从而实现整个数据集的聚类。实验结果表明,该方法能够获得接近整个数据集聚类结果的子集聚类和合并。
Aug, 2023