提出一种新算法 - Laplacian K-modes 聚类算法,它融合了聚类中三种不同的思想:K-means 中的隐式分配变量,mean-shift 中的密度估计,和图拉普拉斯正则化效应中的近邻点相似性分配,该算法可以解决难以聚类的问题,同时提供了一个预测新点的软分配映射。
Jun, 2014
通过密度和簇分配的概念,提出了一种 K-modes 目标函数算法,能够有效地聚类数据并找到有效的模式,相比于 K-medoids 和 mean-shift 更快且更加鲁棒。
Apr, 2013
本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论,包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系,以及对大型数据集的加速策略和图像分割、去噪等应用。
Mar, 2015
本文介绍了一种称为模式聚类的非参数聚类方法,该方法使用密度估计器的模式吸引盆来定义聚类;同时提供了软聚类分配的变种,连接聚类之间的连通性度量,选择带宽的技术,去噪小聚类的方法以及可视化聚类的方法,此外,我们还将模式聚类与其他聚类方法进行了比较。
本文研究了使用混合模型和核密度估计表示的高维概率分布的众数估计的算法问题,提出了基于随机化降维方法的众数近似算法,并且证明了针对某些核函数无法在多项式时间内解决众数估计问题。
May, 2023
本文研究了平均漂移算法中核密度估计模态的收敛性问题,通过 Lojasiewicz 不等式证明了模态的收敛性和收敛速度,该结论对基于核密度估计模态估计的非负核函数具有重要的理论参考价值。
本研究提出了一种基于核估计器和简捷组成样条的方法,通过贝叶斯推理范式实现特征探索、模型选择和模态测试,从而提高概率密度函数的预测精度与模型解释性,在体育分析等领域得到展示,并得到了充分的模拟实验验证。
Jul, 2023
本文通过对核谱聚类方法进行首次分析,发现在维度和数量同时增长的情况下,核矩阵的归一化拉普拉斯矩阵与所谓的尖峰随机矩阵呈类似的渐近行为。通过一种如尖峰矩阵模型的可分离条件,证明该模型中的一些孤立特征值 - 特征向量对携带聚类信息。我们精确评估了这些特征值的位置和特征向量内容,在理论和实践角度揭示了核谱聚类中非常重要(有时相当破坏性)的方面。最后将结果与 MNIST 数据库中图像实际聚类的性能进行比较,证明了理论和实践之间的重要匹配。
Oct, 2015
我们提出了一种非参数特征选择方法,包括多模检验,核密度估计和模式聚类,并提供了聚类结果的错误率边界。此外,我们首次提供了基于模式的聚类的误差界限。
本文提出了一种新的受限聚类算法,该算法可以在考虑已有对比信息的情况下最大程度地满足约束条件,而不会将已知的链接信息转化为距离信息,以此来高效地学习核与度量,并在各种公共数据集上的表现明显优于现有方法。同时,本文还探讨了该方法如何应用于大数据处理,可以有效提高可扩展性。
Mar, 2022