本文提出了一种新颖的基于随机游走的集成聚类方法,通过快速传播集群间相似性解决了现有算法所面临的对象级别信息和多尺度间接联系隐藏等方面的挑战,并提出了两个新的一致性函数以获得一致聚类结果。
Oct, 2018
本文提出了一种新的近似 k-means 算法,采用多个随机空间分区树将数据预先组装成相邻点的组,并使用邻域信息构造每个簇的闭合形式,从而在分配步骤中只需考虑少量簇的候选项,证明该方法在聚类质量和效率方面优于现有的近似 k-means 算法。
Dec, 2013
提出一种新的矩阵近似方法,使用基于协同聚类的加法模型取代低秩分解,实现对多维用户偏好数据的高效建模与近似,其优于传统的低秩分解和协同聚类方法,该方法在 Netflix 问题下表现出色。
Dec, 2014
使用 BETULA 数据聚合算法进行数据聚类,使得在资源受限的系统上使用层次凝聚聚类方法成为可能,仅在聚类质量上有轻微损失,并且允许对非常大的数据集进行探索性数据分析。
Sep, 2023
本文研究了基于 k-median 目标函数的聚类问题,提出了一种称为连续采样的简单但有效的采样技术,并使用该技术开发了一个可在 O(nk)时间内运行的算法来解决 k-median 问题。
Dec, 2012
本文研究高维数据的聚类方法,探讨了 Expectation-Maximization 算法、基于 K-means 的获胜者通吃算法和基于模型的分层凝聚聚类算法,发现 EM 算法在质量上明显优于其他方法,并研究了各种初始化方案对 EM 算法产生的最终解的影响。
Jan, 2013
我们提出了一种基于集合 K 子空间 (EKSS) 的几何方法,该算法通过证据积累聚类框架,形成一个共同关联矩阵,该矩阵的 (i,j) th 项是由多次运行具有随机初始化的 KSS 聚类算法将点 i 和 j 配对在一起的次数。我们表明,当一个算法形成的亲和力矩阵的具有和绝对内积的单调变换接近的条目时,该算法可以提供恢复保证。
Sep, 2017
通过整合基于模型和基于质心的方法,提出了一种高效且自动的聚类技术,解决噪声对聚类质量的影响,并确保无需提前指定聚类数的优点。在模拟和真实数据集上进行了严格评估和统计保证,表明我们提出的方法优于现有先进聚类算法。
Nov, 2023
本文提出了一种基于随机化的近似核 K-means 簇算法,其利用采样点与数据集中所有点之间的核相似性来近似聚类中心,实现了与传统低秩核近似聚类方案相比更好的聚类性能、更短的运行时间和更小的内存需求,最后利用集成聚类技术进一步提高算法性能。
Feb, 2014
我们构建了一个交叉熵聚类(CEC)理论,通过自动删除不含信息的群体来找到最优聚类数量。此外,我们的理论提供了简单有效的标准来验证聚类有效性。
Oct, 2012