一篇聚类算法的均值漂移综述

Mar, 2015

A review of mean-shift algorithms for clustering

Miguel Á. Carreira-Perpiñán

TL;DR本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论，包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系，以及对大型数据集的加速策略和图像分割、去噪等应用。

Abstract

A natural way to characterize the cluster structure of a dataset is by finding regions containing a high density of data. This can be done in a nonparametric way with a kernel density estimate, whose modes and hence clusters can be found using →

cluster structure kernel density estimates mean-shift algorithms scale-space theory image segmentation

发现论文，激发创造

Laplacian K-modes 算法聚类

提出一种新算法 - Laplacian K-modes 聚类算法，它融合了聚类中三种不同的思想：K-means 中的隐式分配变量，mean-shift 中的密度估计，和图拉普拉斯正则化效应中的近邻点相似性分配，该算法可以解决难以聚类的问题，同时提供了一个预测新点的软分配映射。

Jun, 2014

基于特征加权均值漂移算法的高维数据自动聚类

我们提出了一种简单而优雅的特征加权变体均值漂移算法，可有效学习特征的重要性，从而将均值漂移的优点扩展到高维数据，其不仅优于传统的均值漂移聚类过程，而且还保留了计算上的简单性。此外，所提出的方法具有严格的理论收敛保证和至少三次收敛速率。

Dec, 2020

基于 K-modes 算法的聚类

通过密度和簇分配的概念，提出了一种 K-modes 目标函数算法，能够有效地聚类数据并找到有效的模式，相比于 K-medoids 和 mean-shift 更快且更加鲁棒。

Apr, 2013

随机均值漂移聚类

本研究提出了一种基于随机版本均值漂移聚类算法，与确定性的均值漂移聚类相比，在合成的二维和三维数据集上进行了集群纯度和类数据纯度的比较，发现随机均值漂移聚类在大多数情况下优于确定性均值漂移。

Dec, 2023

均值漂移的收敛分析

本文研究了平均漂移算法中核密度估计模态的收敛性问题，通过 Lojasiewicz 不等式证明了模态的收敛性和收敛速度，该结论对基于核密度估计模态估计的非负核函数具有重要的理论参考价值。

May, 2023

Epanechnikov 均值漂移的收敛性

本论文分析了 Epanechnikov Mean Shift 算法的收敛行为，提出了一种修正方案使其保证在有限次迭代内在估计密度的局部最大值处结束，而无需从每个数据点开始进行迭代，具有很好的聚类准确性。

Nov, 2017

可扩展核聚类：近似核 k-means

本文提出了一种基于随机化的近似核 K-means 簇算法，其利用采样点与数据集中所有点之间的核相似性来近似聚类中心，实现了与传统低秩核近似聚类方案相比更好的聚类性能、更短的运行时间和更小的内存需求，最后利用集成聚类技术进一步提高算法性能。

Feb, 2014

模式聚类的综合方法

本文介绍了一种称为模式聚类的非参数聚类方法，该方法使用密度估计器的模式吸引盆来定义聚类；同时提供了软聚类分配的变种，连接聚类之间的连通性度量，选择带宽的技术，去噪小聚类的方法以及可视化聚类的方法，此外，我们还将模式聚类与其他聚类方法进行了比较。

Jun, 2014

广义密度聚类

本研究研究了广义密度聚类，提出了两种数据基础方法来选择波宽，并研究了密度聚类的稳定性，表明一种简单的基于图的算法可以成功地近似高密度聚类。

Jul, 2009

鲁棒自动数据聚类：狄利克雷过程遇见中位数均值

通过整合基于模型和基于质心的方法，提出了一种高效且自动的聚类技术，解决噪声对聚类质量的影响，并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证，表明我们提出的方法优于现有先进聚类算法。

Nov, 2023