非监督学习中的聚类是一个基础问题,本研究介绍了一种简单的随机聚类算法,它在任意 k 下的期望运行时间为 O (nnz (X) + nlogn),并在 K-means 目标函数上实现了近似比例约为 O (k^4) 的算法,通过实验证明与现有方法相比,我们的聚类算法在运行时间和聚类质量之间有一个新的权衡。
本文研究了 Ward 方法在分层 k 均值问题中的应用,通过对完全链接的算法进行分析,发现当最优 k 聚类具有良好分离性时,Ward 方法可以计算出 k - 均值目标函数的 2 - 近似解,并证明了当最优聚类满足平衡条件时,Ward 方法完全恢复最优解,并且我们证明了一维数据集的 Ward 聚类可以实现 O (1) 的近似解。