带谱范数和 k-means 算法的聚类

Apr, 2010

Clustering with Spectral Norm and the k-means Algorithm

Amit Kumar, Ravindran Kannan

TL;DR该论文证明了一个简单的聚类算法可以在不假设任何生成模型的情况下运作，只需要假定一种叫做 “接近条件” 的规律。该算法依赖于著名的 k-means 算法，能够产生大多数现有生成模型的结果，同时提出了一种新的技术来提高间距与标准差之比。

Abstract

There has been much progress on efficient algorithms for clustering data points generated by a mixture of $k$ probability distributions under the assumption that the means of the distributions are well-separated, i.e., the distance between the means of any two distributions is at least

clustering generative models k-means algorithm proximity condition inter-center separation

发现论文，激发创造

聚类的改进谱范数界限

本文旨在通过改进 Kumar 和 Kannan [2010] 的分离条件，探讨聚类混合分布。本文通过较弱的分离条件和接近度条件，得出了具有低误差和低 k - 均值成本的聚类结果，在某些情况下能够改进高斯模型的分离结果。

Jun, 2012

基于局部线性逼近的谱聚类

本文研究了一种基于局部线性逼近残差的高阶谱聚类方法，考虑了聚类过程中的数据噪声和异常值问题，并在实验中验证了该算法具有更好的聚类效果。

Jan, 2010

大维数据的核谱聚类

本文通过对核谱聚类方法进行首次分析，发现在维度和数量同时增长的情况下，核矩阵的归一化拉普拉斯矩阵与所谓的尖峰随机矩阵呈类似的渐近行为。通过一种如尖峰矩阵模型的可分离条件，证明该模型中的一些孤立特征值 - 特征向量对携带聚类信息。我们精确评估了这些特征值的位置和特征向量内容，在理论和实践角度揭示了核谱聚类中非常重要（有时相当破坏性）的方面。最后将结果与 MNIST 数据库中图像实际聚类的性能进行比较，证明了理论和实践之间的重要匹配。

Oct, 2015

带最优图的统一谱聚类

本文提出了一种改进的光谱聚类算法，旨在解决预定义的相似性图可能不是合适的聚类结果，并且传统离散化解决方法与光谱解决方案可能不一致的问题，并引入多核学习来解决如何选择最适合特定数据集的核的应用挑战。实验结果表明，该方法相比于现有的聚类方法具有更好的性能。

Nov, 2017

通过幂法的谱聚类 —— 可证明性

本文通过理论分析证明，在光谱聚类时，使用小量的幂迭代即可通过近似特征向量来达到接近最优的 K-means 聚类结果。

Nov, 2013

谱聚类的更紧密分析，以及更多

本研究针对典型的谱聚类算法，探讨在一些较弱条件下其性能为何，还研究了利用少于 k 个特征向量进行嵌入的谱聚类，实验表明在合成和真实数据上，使用少于 k 个特征向量时，谱聚类也能够产生相当或更好的结果。

Aug, 2022

归一化在随机块模型谱聚类中的作用

本文讨论了谱聚类技术和其相应的归一化和未归一化变体，针对随机块模型，理论上证明了归一化可以在广泛的参数范围内使数据点聚集在一起。

Oct, 2013

理论与实践中的快速简单谱聚类

本研究提出了一种基于顶点嵌入的简单谱聚类算法，通过幂法计算的向量，在接近线性时间内计算顶点嵌入，并在输入图形的自然假设下，算法能够可靠地恢复出真实聚类结果。通过在多个合成和现实世界数据集上的评估发现，该算法与其他聚类算法相比，具有显著更快的速度，并且产生的聚类准确度基本相同。

Oct, 2023

压缩谱聚类

本文提出了一种基于图信号处理的方法，采用图滤波和随机采样技术加速生成 Laplacian 矩阵特征向量和 k-means 聚类算法步骤，该方法在控制误差的同时计算时间效率可达到数个数量级的提升，并在人工合成数据和真实网络数据集上进行测试。

Feb, 2016

一维投影聚类的简单、可扩展和有效方法

非监督学习中的聚类是一个基础问题，本研究介绍了一种简单的随机聚类算法，它在任意 k 下的期望运行时间为 O (nnz (X) + nlogn)，并在 K-means 目标函数上实现了近似比例约为 O (k^4) 的算法，通过实验证明与现有方法相比，我们的聚类算法在运行时间和聚类质量之间有一个新的权衡。

Oct, 2023