Wasserstein 度量空间中的规范变量
本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度(如多重直方图或点云)的最新统计学贡献,并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处,用于学习数据集中几何变化的主要模式。同时,本文讨论了与统计优化输运相关的一些研究方向。
Jul, 2019
使用本地 PCA 算法估计嵌入的欧几里得空间中光滑紧致亚流形的维数和正切空间需要的样本点数具有数学严格的上界,该估计考虑了非均匀数据分布和可能跨越亚流形变化的噪声,并允许在多个点上同时进行估计。
Oct, 2021
此研究介绍了一种基于 Wasserstein 距离的方法,用于高维数问题中的 Gaussian 混合模型的优化问题,并讨论了它的性质和在图像处理中的应用。
Jul, 2019
论文阐述了位于 Wasserstein 空间的数据流形学习中的关于随机向量在 $\mathbb {R}^n$ 中的二次 Wasserstein 距离的一些已知下界,重点考虑应用于数据的仿射变换。具体而言,通过计算协方差矩阵之间的 Bures 度量,给出了关于在 $\mathbb {R}^2$ 中具有不相关分量的随机向量的旋转副本的具体下界。我们还推导了由仿射映射组成的上界,从而产生了多样的微分同胚,应用于初始数据度量。我们将这些界限应用于各种分布,包括位于 $\mathbb {R}^2$ 中的 1 维流形上的分布,并展示了界限的质量。最后,我们提出了一个可以应用于流形学习框架中的模仿手写数字或字母数据集的框架。
Oct, 2023
论文提供了关于在 Wasserstein 损失下仅使用样本空间的测度性质和概率分布的弱矩假设,对于概率分布的估计的统计极小值率上下界的研究。
Feb, 2018
本文旨在建立流形学习算法在紧凸子集上绝对连续概率测度空间中的理论基础,其中测度空间以 Wasserstein-2 距离 W 度量。我们首先介绍了概率测度子流形 Λ 的一种自然构造,配备了度量 Wλ,这是 W 对 Λ 的测地距离限制。与其他构造形成对比,这些子流形不一定是平坦的,但仍然允许类似于 Riemann 流形的局部线性化。然后,我们展示了如何仅通过 Λ 的样本集合和外在 Wasserstein 距离 W 来学习(Λ,Wλ)的潜在流形结构。特别地,我们展示了度量空间(Λ,Wλ)可以从具有节点 Λ 样本集合和边权重 W (λi, λj) 的图中,按照 Gromov-Wasserstein 的意义上逐渐恢复。此外,我们通过对从 λ 到足够接近和不同的样本 Λ 集合中,使用最优输运映射的合适 “协方差算符” 的谱分析,展示了如何渐近地恢复样本 λ 处的切空间。本文最后给出了一些关于子流形 Λ 的具体构造以及通过谱分析恢复切空间的数值例子。
Nov, 2023
本文提出一种基于最优输运的聚类方法,它通过使用变分原理求解最优输运,并研究使用力图来将任意域聚合为固定数量的聚类。通过迭代地将聚类中心驱动到目标域中,并通过调整力图来保持最小聚类能量,从而同时追求聚类和聚类中心与目标域之间的 Wasserstein 距离。作者在合成和真实数据的领域自适应、重新网格化和表示学习方面演示了该方法的应用。
Jun, 2018
该研究针对比较随机变量分布及定义事件样本的平均模式等问题,使用 Wasserstein 空间的测度重心提出一个迭代版本进行平均分布的估计,并且当分布是由居中随机算子扭曲的常见措施时,则测地线能恢复该分布模板。
Nov, 2011