向量扩散图和连接拉普拉斯算子
本文研究数据分析中的低维数据表示问题,提出了一种名为扩散映射的算法,能够将复杂高维数据嵌入低维欧几里得空间,从而实现长时间演化系统的高效识别与聚类分析。
Mar, 2005
本文研究了从连续矩阵群操作下闭合的流形采样的数据嵌入问题,提出并证明了特定矩阵的特征向量与群的幺模表示元素的张量积可导出表征群作用的扩散映射,该方法在聚类和配准数据点方面表现出色。
Jun, 2023
本文提出了一种新颖的扩散映射粒子系统(DMPS)用于生成建模,基于扩散映射和拉普拉斯调整的 Wasserstein 梯度下降 (LAWGD),采用扩散映射来近似 Langevin 扩散过程的生成器从而学习潜在的数据生成流形,而 LAWGD 可通过合适的内核实现从目标分布进行高效采样。数值实验证明了我们方法在合成数据集上的优越性,包括具有流形结构的示例。
Apr, 2023
本文提出了一种名为 Manifold Diffusion Fields(MDF)的方法来学习定义在黎曼流形上的连续函数的生成模型,该方法利用了谱几何分析的见解,在流形上定义了一种内在坐标系统,MDF 使用由多个输入输出对形成的显式参数化来表示函数,该方法允许在流形上采样连续函数,并且对于流形的刚性和等距变换是不变的,实证结果表明,与之前的方法相比,MDF 可以更好地捕捉这些函数的分布,具有更好的多样性和保真度。
May, 2023
本文提出了一种计算大规模相关高维数据集之间的距离的快速方法,称为扩散地球移位距离(Diffusion Earth Mover's Distance)。通过建模数据集为分布并计算相互作用矩阵来实现,该方法的时间复杂度为 O (n),并且比基于树的算法更加准确和可微分,适用于深度神经网络等梯度下降框架。实验通过 210 个 COVID-19 样本的单细胞数据表明该方法比同等精确度的方法至少快两个数量级,且可以嵌入更高层次的患者流形中揭示患者间的结构和异质性,并可适用于其他医学和生物模型中大规模数据集的距离计算。
Feb, 2021
采用扩散映射对词语网络嵌入进行建模,以更好地捕捉文本之间的语义联系,并提供一种新的目标函数来有效保留多阶接近度。该方法在顶点分类和链路预测任务上优于最先进的方法。
May, 2018
本文介绍了一种新的图像生成和似然估计方法 —— 扩展连续时间扩散模型到任意黎曼流形,提出了一种似然估计变分框架,并在黎曼流形上证明其等价性,证明了这种新方法在各个评测标准上得到了新的最先进的表现。
Aug, 2022
该论文提出了一种基于扩散的谱聚类和降维算法的概率解释,利用规范化图拉普拉斯算子的特征向量。通过定义数据点之间的扩散距离,并证明了对应马尔科夫矩阵的前几个特征向量的低维表示在一定均方误差标准下是最佳的。此外,假设数据点是从密度 $p (x)=e^{-U (x)}$ 中随机抽取的,作者将这些特征向量视为具有反射边界条件下潜在 $2U (x)$ 力学势中福克 - 普朗克算子的离散近似的本征函数。最后,应用已知结果,对连续福克 - 普朗克算子的本征值和本征函数进行解析,从而为基于前几个特征向量的谱聚类和降维算法的成功提供了数学论证。这项分析阐明了许多经验发现关于谱聚类算法的特征和扩散进程。
Jun, 2005
这篇研究主要讲述了如何将非线性流形学习方法 ——Diffusion Maps 扩展到函数数据,并在不同的仿真和实例中将其行为与函数 PCA 进行比较,以便进行功能数据分析和降维。
Apr, 2023