一篇聚类算法的均值漂移综述
提出一种新算法 - Laplacian K-modes 聚类算法,它融合了聚类中三种不同的思想:K-means 中的隐式分配变量,mean-shift 中的密度估计,和图拉普拉斯正则化效应中的近邻点相似性分配,该算法可以解决难以聚类的问题,同时提供了一个预测新点的软分配映射。
Jun, 2014
我们提出了一种简单而优雅的特征加权变体均值漂移算法,可有效学习特征的重要性,从而将均值漂移的优点扩展到高维数据,其不仅优于传统的均值漂移聚类过程,而且还保留了计算上的简单性。此外,所提出的方法具有严格的理论收敛保证和至少三次收敛速率。
Dec, 2020
通过密度和簇分配的概念,提出了一种 K-modes 目标函数算法,能够有效地聚类数据并找到有效的模式,相比于 K-medoids 和 mean-shift 更快且更加鲁棒。
Apr, 2013
本研究提出了一种基于随机版本均值漂移聚类算法,与确定性的均值漂移聚类相比,在合成的二维和三维数据集上进行了集群纯度和类数据纯度的比较,发现随机均值漂移聚类在大多数情况下优于确定性均值漂移。
Dec, 2023
本文研究了平均漂移算法中核密度估计模态的收敛性问题,通过 Lojasiewicz 不等式证明了模态的收敛性和收敛速度,该结论对基于核密度估计模态估计的非负核函数具有重要的理论参考价值。
May, 2023
本论文分析了 Epanechnikov Mean Shift 算法的收敛行为,提出了一种修正方案使其保证在有限次迭代内在估计密度的局部最大值处结束,而无需从每个数据点开始进行迭代,具有很好的聚类准确性。
Nov, 2017
本文提出了一种基于随机化的近似核 K-means 簇算法,其利用采样点与数据集中所有点之间的核相似性来近似聚类中心,实现了与传统低秩核近似聚类方案相比更好的聚类性能、更短的运行时间和更小的内存需求,最后利用集成聚类技术进一步提高算法性能。
Feb, 2014
本文介绍了一种称为模式聚类的非参数聚类方法,该方法使用密度估计器的模式吸引盆来定义聚类;同时提供了软聚类分配的变种,连接聚类之间的连通性度量,选择带宽的技术,去噪小聚类的方法以及可视化聚类的方法,此外,我们还将模式聚类与其他聚类方法进行了比较。
Jun, 2014
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023