通过密度和簇分配的概念,提出了一种 K-modes 目标函数算法,能够有效地聚类数据并找到有效的模式,相比于 K-medoids 和 mean-shift 更快且更加鲁棒。
Apr, 2013
提出了一种新的 k-medoids 聚类算法,该算法只需要一小部分数据点之间的距离,并利用三角不等式来估算未知距离的上界,并采用递归方法和主动选择数据点的方法,在真实世界和合成数据集上经验证明其能够找出合适的聚类效果。
Dec, 2015
本篇论文研究层次聚类的优化问题,通过提出一些可靠的任务目标函数并对实际算法进行分析,提供了更优的算法以及性能表现。
Apr, 2017
本文研究使用k-medoids算法对数据序列进行聚类。提出了基于分布距离度量的k-medoids算法,对已知和未知的分布簇数进行聚类分析。提供了错误概率的上限和大样本情况下的收敛结果。当符合某些条件时,而且使用Kolmogrov-Smirnov距离或最大平均差异作为距离度量时,错误指数具有简单的形式。模拟结果证明了所提出分析的可行性。
Jul, 2018
本文研究了基于度量空间中的聚类点的算法和优化,提出了一种通用的类Lloyd算法的无限算法族,利用有效的学习算法从特定于应用程序的聚类实例分布中学习到了最佳聚类算法,包括著名的k-means ++算法及其它。
Sep, 2018
本文提出了PAM算法的修改,以达到算法第二个步骤中O(k)倍的加速,同时发掘了选择初始核心点的其他策略,实验证明与原始PAM SWAP算法相比,算法速度可提升200倍,适用于大型数据集和更高的K值。
Oct, 2018
该论文提出了一种流式k-medoids算法的变种SECLEDS,它使用多个质心聚类,通过中心投票方案处理数据流中的概念漂移,以实现高效的序列聚类,同时提高聚类的质量和稳定性,并证明了其在网络流量聚类中的较高性能。
Jun, 2022
BanditPAM++是一种改进的$k$-medoids聚类算法,通过两个算法改进在复杂度和运行时间上比BanditPAM更快,并提供了可从Python和R调用的高性能C++实现。
Oct, 2023
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023
提出了EKM算法,该算法利用转化式编程和组合生成的最新进展,以确保准确解决关键点聚类问题并在多个真实世界数据集上证明了其有效性。
May, 2024