基于 K-modes 算法的聚类
提出一种新算法 - Laplacian K-modes 聚类算法,它融合了聚类中三种不同的思想:K-means 中的隐式分配变量,mean-shift 中的密度估计,和图拉普拉斯正则化效应中的近邻点相似性分配,该算法可以解决难以聚类的问题,同时提供了一个预测新点的软分配映射。
Jun, 2014
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023
我们提出了一种新的算法 Laplacian K-modes,并通过优化一个紧密的辅助函数提高了其可伸缩性,进而实现了大规模数据的并行化聚类和密度模式查找,并在各种数据集上进行了全面的实验。
Oct, 2018
本文介绍了一种称为模式聚类的非参数聚类方法,该方法使用密度估计器的模式吸引盆来定义聚类;同时提供了软聚类分配的变种,连接聚类之间的连通性度量,选择带宽的技术,去噪小聚类的方法以及可视化聚类的方法,此外,我们还将模式聚类与其他聚类方法进行了比较。
Jun, 2014
本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论,包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系,以及对大型数据集的加速策略和图像分割、去噪等应用。
Mar, 2015
提出了一种新的 k-medoids 聚类算法,该算法只需要一小部分数据点之间的距离,并利用三角不等式来估算未知距离的上界,并采用递归方法和主动选择数据点的方法,在真实世界和合成数据集上经验证明其能够找出合适的聚类效果。
Dec, 2015
介绍了将基于距离矩阵的聚类算法 Medoid-Shift 应用于社区检测问题,并通过改进,提出了适用于社区检测的 Revised Medoid-Shift 算法,该算法采用基于 KNN (最近邻) 的邻域算法,收敛更为稳定。
Apr, 2023
本文研究使用 k-medoids 算法对数据序列进行聚类。提出了基于分布距离度量的 k-medoids 算法,对已知和未知的分布簇数进行聚类分析。提供了错误概率的上限和大样本情况下的收敛结果。当符合某些条件时,而且使用 Kolmogrov-Smirnov 距离或最大平均差异作为距离度量时,错误指数具有简单的形式。模拟结果证明了所提出分析的可行性。
Jul, 2018
本文提出了一种新颖的模糊 K-Means 聚类算法,通过距离矩阵计算获得成员矩阵,从而完全消除了对聚类中心的依赖,增强了距离测量和算法的性能与鲁棒性。实验证明了该算法的有效性。
Apr, 2024
本文提出了一种使用决策树对数据集进行聚类的算法,并探讨了该方法对 k-means 和 k-medians 目标函数的适用性。作者证明了常见的自顶向下决策树算法可能会导致成本任意大的聚类结果,但设计了一种有效的方法使用具有 k 个叶子的树生成可解释的聚类,并对于两个中心点的情况,仅需要一个阈值切割即可实现常数近似。
Feb, 2020