我们提出了一种非参数特征选择方法,包括多模检验,核密度估计和模式聚类,并提供了聚类结果的错误率边界。此外,我们首次提供了基于模式的聚类的误差界限。
Jun, 2014
通过密度和簇分配的概念,提出了一种 K-modes 目标函数算法,能够有效地聚类数据并找到有效的模式,相比于 K-medoids 和 mean-shift 更快且更加鲁棒。
Apr, 2013
提出一种新算法 - Laplacian K-modes 聚类算法,它融合了聚类中三种不同的思想:K-means 中的隐式分配变量,mean-shift 中的密度估计,和图拉普拉斯正则化效应中的近邻点相似性分配,该算法可以解决难以聚类的问题,同时提供了一个预测新点的软分配映射。
本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论,包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系,以及对大型数据集的加速策略和图像分割、去噪等应用。
Mar, 2015
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023
我们提出了一种新的算法 Laplacian K-modes,并通过优化一个紧密的辅助函数提高了其可伸缩性,进而实现了大规模数据的并行化聚类和密度模式查找,并在各种数据集上进行了全面的实验。
Oct, 2018
本文旨在通过为最理想的种群聚类提供一个明确的公式来深入探讨通常的非参数聚类方法的理论基础,该方法将聚类视为高密度区域。
Dec, 2012
本研究研究了广义密度聚类,提出了两种数据基础方法来选择波宽,并研究了密度聚类的稳定性,表明一种简单的基于图的算法可以成功地近似高密度聚类。
Jul, 2009
本研究提出了一种基于核估计器和简捷组成样条的方法,通过贝叶斯推理范式实现特征探索、模型选择和模态测试,从而提高概率密度函数的预测精度与模型解释性,在体育分析等领域得到展示,并得到了充分的模拟实验验证。
Jul, 2023
本研究提出了一种新的方法,可以在良好的分布条件下估计任何密度函数的局部极大值,并可以估计所有这些局部极大值或模态集,适用于任何有界形状或维度,包括通常的点模式,并在聚类应用中表现出竞争力,并且在调整参数的范围内具有相当稳定性。
Jun, 2016