测地线空间中的 Wasserstein PCA
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时,本文讨论了与统计优化输运相关的一些研究方向。
Jul, 2019
本文探讨了在概率测度空间 P(X)中,使用最优传输(Wasserstein)几何将被限制为该度量下的测地线段的曲线,以高效地总结该系列测度。我们展示了在最优传输几何中,重要概念可以通过使用 Wasserstein 平均值和微分几何,找到自然的等效物。然而,应用这些想法是具有挑战性的。为了处理数千个测度和实现可扩放的算法,我们建议使用放松的测地线定义和正则化的最优传输距离。本文的方法在将图像视为形状或颜色直方图方面具有重要意义。
Jun, 2015
该论文提出了一种代数几何解决从样本数据点分割未知数量和不同维度的子空间的问题的方法,并且使用一组次数为子空间数量的齐次多项式来表示子空间,并且在数据中线性估计这些多项式,从而将子空间分割降为每个子空间分类一个点,并且通过最小化某个距离函数从数据集中最优地选择这些点,然后应用标准 PCA 到导数(法向矢量)的集合来恢复每个子空间的补充基础,最后在多个仿射视图中从点对应中对 GPCA 的应用进行了探讨。
Feb, 2012
使用本地 PCA 算法估计嵌入的欧几里得空间中光滑紧致亚流形的维数和正切空间需要的样本点数具有数学严格的上界,该估计考虑了非均匀数据分布和可能跨越亚流形变化的噪声,并允许在多个点上同时进行估计。
Oct, 2021
研究生成敌对网络是一个强大的框架,而文中的研究将 GANs 应用于简单的线性生成器高斯数据场景下,发现原 GAN 无法恢复最优 PCA 解,而 Wasserstein GAN 可以在样本大小的极限下接近 PCA 解,因此可能成为一种基于广泛数据设置的最优 GAN 体系结构的基础。
Feb, 2019
研究如何将主成分分析 (PCA) 推广到黎曼流形上,提出了一种新的子空间类型 —— 重心子空间,并将 PCA 重新表述为线性子空间族上的最优化问题,以构造具有 affine spans 的 Flag 的子空间层次嵌套来优化积累未解释方差 (AUV) 标准,在黎曼流形中进行最优的 PCA 推广 ——Barycentric Subspaces Analysis (BSA)。
Jul, 2016
本文旨在建立流形学习算法在紧凸子集上绝对连续概率测度空间中的理论基础,其中测度空间以 Wasserstein-2 距离 W 度量。我们首先介绍了概率测度子流形 Λ 的一种自然构造,配备了度量 Wλ,这是 W 对 Λ 的测地距离限制。与其他构造形成对比,这些子流形不一定是平坦的,但仍然允许类似于 Riemann 流形的局部线性化。然后,我们展示了如何仅通过 Λ 的样本集合和外在 Wasserstein 距离 W 来学习(Λ,Wλ)的潜在流形结构。特别地,我们展示了度量空间(Λ,Wλ)可以从具有节点 Λ 样本集合和边权重 W (λi, λj) 的图中,按照 Gromov-Wasserstein 的意义上逐渐恢复。此外,我们通过对从 λ 到足够接近和不同的样本 Λ 集合中,使用最优输运映射的合适 “协方差算符” 的谱分析,展示了如何渐近地恢复样本 λ 处的切空间。本文最后给出了一些关于子流形 Λ 的具体构造以及通过谱分析恢复切空间的数值例子。
Nov, 2023
利用最优输运的几何特性提出了一种新的光滑插值概率测度的方法,并将问题简化为经典的欧几里得设置,使我们可以直接利用样条插值的广泛工具箱。与以前的测量值样条的方法不同,我们的插值曲线(i)具有自然的粒子流控制解释,这对于应用非常自然,并且(ii)附带了 Wasserstein 空间上的第一个近似保证。最后,展示了利用薄板样条拟合测度曲面的插值方法的广泛适用性。
Oct, 2020