从流形学习的角度重新思考 k-means
本研究提出了 Distance Learner 方法,利用 “流形假设” 作为先验知识,对于 DNN-based 分类器进行训练,结果表明 Distance Learner 相比标准分类器学习到更有意义的分类边界,并且在对抗鲁棒性任务中表现出色。
Jul, 2022
提出一种新算法 - Laplacian K-modes 聚类算法,它融合了聚类中三种不同的思想:K-means 中的隐式分配变量,mean-shift 中的密度估计,和图拉普拉斯正则化效应中的近邻点相似性分配,该算法可以解决难以聚类的问题,同时提供了一个预测新点的软分配映射。
Jun, 2014
本文研究了从随机样本中估计流形的问题,并分析了由 k 均值和 k - 平面诱导的分段常数和分段线性估计器的性能。还扩展了先前对 k 均值的结果,提供了 k - 均值重建流形的新结果,并为高阶逼近(k - 平面)证明了重建界限。
Sep, 2012
本文提出了一种新颖的模糊 K-Means 聚类算法,通过距离矩阵计算获得成员矩阵,从而完全消除了对聚类中心的依赖,增强了距离测量和算法的性能与鲁棒性。实验证明了该算法的有效性。
Apr, 2024
通过对优化传输具有二次正则化的对称版本的利用来构建稀疏且自适应的亲和矩阵的流形学习方法,从而检测数据嵌入的潜在流形是广泛一类下游分析的先决条件。我们证明了连续极限中产生的核函数与拉普拉斯类型算子一致,并在模拟中展示了对异方差噪声的鲁棒性,我们还确定了适用于离散数据的计算该优化传输的高效计算方案,并证明在一系列示例中它优于竞争方法。
Jul, 2023
提出一种基于核的方法,用于构建定义函数,它可以应用于从完全维数的流形到点云的任意有界光滑流形的内插和分析,通过线性组合平移核函数得到签名函数,可用于估计维数、法向量和曲率,方法以全局性、不依赖于数据集中其他结构的特点,通过一种变分形式进行正则化,克服了噪音和误差的问题。
Mar, 2024
该论文证明了一个简单的聚类算法可以在不假设任何生成模型的情况下运作,只需要假定一种叫做 “接近条件” 的规律。该算法依赖于著名的 k-means 算法,能够产生大多数现有生成模型的结果,同时提出了一种新的技术来提高间距与标准差之比。
Apr, 2010
本文讨论了基于核密度估计和均值漂移算法的聚类方法及其理论,包括模糊和非模糊均值漂移、高斯混合模型、与尺度空间理论、谱聚类等算法的联系,以及对大型数据集的加速策略和图像分割、去噪等应用。
Mar, 2015
本文针对多维数组数据具有丰富结构,而向量化方法难以完整表述结构信息的问题,提出了一种基于新型异构 Tucker 分解模型的子空间聚类算法,并探究了二阶黎曼几何的多项式流形及核心域中的优化问题。数值实验表明,该算法与基于张量因数分解的最新聚类算法竞争效果明显。
Apr, 2015
本研究提出了一种在机器人学习中处理非欧几里德流形数值数据的本质方法,该方法通过在流形上选择适当的概率分布,并将其参数作为预测变量的函数进行非参数化估计,同时结合核函数的局部似然方法,实现了比投影算法更好的预测准确性。
Oct, 2023