可扩展核聚类:近似核 k-means
通过将线性 k - 均值聚类应用于使用称为等级限制的 Nyström 近似构造的 {k/epsilon}(1+o (1)) 特征,本文分析了该范例应用于核 k - 均值聚类,并表明相对于不使用 Nyström 方法提供的保证,计算出的群集分配会满足相对于核 k-means 成本函数的 1+epsilon 逼近度。
Jun, 2017
本文提出了一种新的近似 k-means 算法,采用多个随机空间分区树将数据预先组装成相邻点的组,并使用邻域信息构造每个簇的闭合形式,从而在分配步骤中只需考虑少量簇的候选项,证明该方法在聚类质量和效率方面优于现有的近似 k-means 算法。
Dec, 2013
本文研究了随机特征逼近在核主成分分析中的应用,通过比较计算效率和统计效率,分析了逼近 KPCA 的计算和统计性能优于 KPCA,研究依赖于自伴随 Hilbert-Schmidt 算子值 U 统计量的算子和 Hilbert-Schmidt 范数的 Bernstein 型不等式。
Jun, 2017
非监督学习中的聚类是一个基础问题,本研究介绍了一种简单的随机聚类算法,它在任意 k 下的期望运行时间为 O (nnz (X) + nlogn),并在 K-means 目标函数上实现了近似比例约为 O (k^4) 的算法,通过实验证明与现有方法相比,我们的聚类算法在运行时间和聚类质量之间有一个新的权衡。
Oct, 2023
为解决相似性测量困难及非线性相似性未被充分考虑等问题,在核空间中提出一种模型,同时学习聚类指示器矩阵和相似度信息,并通过多核学习能力进一步扩展模型以选择最合适的内核。该模型可自动完成三个子任务以获得最佳聚类解决方案。
May, 2017
本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论,包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系,以及对大型数据集的加速策略和图像分割、去噪等应用。
Mar, 2015
通过基于随机投影导出的特征近似核函数,提出了有效地克服核方法计算复杂度的方法,并在图像识别和语音识别等大规模学习问题上成功地比较了核方法和深度神经网络的性能,同时克服了模型调节的困难。
Nov, 2014
本文考虑在 MapReduce 环境下设计用于处理大数据集的聚类算法,重点研究实用和流行的聚类问题,如 k-center 和 k-median,并开发具有常数因子近似保证的快速聚类算法。
Sep, 2011
本文研究了基于 k-median 目标函数的聚类问题,提出了一种称为连续采样的简单但有效的采样技术,并使用该技术开发了一个可在 O(nk)时间内运行的算法来解决 k-median 问题。
Dec, 2012