Wasserstein 度量空间中的规范变量

May, 2024

Canonical Variates in Wasserstein Metric Space

Jia Li, Lin Lin

TL;DR本文提出了一种基于 Wasserstein 度量的分布化空间中的实例分类方法，其中包括使用 k 最近邻算法、k 均值聚类和伪混合建模等基于距离的分类算法。通过最大化 Fisher 比例的原则，通过迭代算法在向量空间中进行比例最大化来实现此方法，以增强分类性能，并证明其优于操作基于分布数据的向量表示的已建立算法。

Abstract

In this paper, we address the classification of instances each characterized not by a singular point, but by a distribution on a vector space. We employ the wasserstein metric to measure distances between distributions, which are then used by →

wasserstein metric distance-based classification algorithms dimension reduction fisher's ratio iterative algorithm

发现论文，激发创造

Wasserstein 空间中的统计数据分析

本文介绍利用 Wasserstein 距离和最优输运理论分析数据集中随机概率测度（如多重直方图或点云）的最新统计学贡献，并重点介绍在 Wasserstein 空间中使用重心和测地线 PCA 的好处，用于学习数据集中几何变化的主要模式。同时，本文讨论了与统计优化输运相关的一些研究方向。

Jul, 2019

用 Wasserstein 距离估计切空间和维数

使用本地 PCA 算法估计嵌入的欧几里得空间中光滑紧致亚流形的维数和正切空间需要的样本点数具有数学严格的上界，该估计考虑了非均匀数据分布和可能跨越亚流形变化的噪声，并允许在多个点上同时进行估计。

Oct, 2021

高斯混合模型空间中的 Wasserstein 型距离

此研究介绍了一种基于 Wasserstein 距离的方法，用于高维数问题中的 Gaussian 混合模型的优化问题，并讨论了它的性质和在图像处理中的应用。

Jul, 2019

关于随机向量的仿射变换的 Wasserstein 距离

论文阐述了位于 Wasserstein 空间的数据流形学习中的关于随机向量在 $\mathbb {R}^n$ 中的二次 Wasserstein 距离的一些已知下界，重点考虑应用于数据的仿射变换。具体而言，通过计算协方差矩阵之间的 Bures 度量，给出了关于在 $\mathbb {R}^2$ 中具有不相关分量的随机向量的旋转副本的具体下界。我们还推导了由仿射映射组成的上界，从而产生了多样的微分同胚，应用于初始数据度量。我们将这些界限应用于各种分布，包括位于 $\mathbb {R}^2$ 中的 1 维流形上的分布，并展示了界限的质量。最后，我们提出了一个可以应用于流形学习框架中的模仿手写数字或字母数据集的框架。

Oct, 2023

Wasserstein 判别分析

Wasserstein 判别分析是一种新的有监督方法，可以通过计算适当的线性映射到较低维子空间来提高高维数据的分类性能。

Aug, 2016

Wasserstein 距离的统计学特征

本文介绍了 Wasserstein 距离作为概率分布度量的数学概念，以及其在统计学中的重要应用，包括了弱收敛、矩收敛、概率分布扰动等内容。

Jun, 2018

Wasserstein 距离下的 Minimax 分布估计

论文提供了关于在 Wasserstein 损失下仅使用样本空间的测度性质和概率分布的弱矩假设，对于概率分布的估计的统计极小值率上下界的研究。

Feb, 2018

Wasserstein 空间中的流形学习

本文旨在建立流形学习算法在紧凸子集上绝对连续概率测度空间中的理论基础，其中测度空间以 Wasserstein-2 距离 W 度量。我们首先介绍了概率测度子流形 Λ 的一种自然构造，配备了度量 Wλ，这是 W 对 Λ 的测地距离限制。与其他构造形成对比，这些子流形不一定是平坦的，但仍然允许类似于 Riemann 流形的局部线性化。然后，我们展示了如何仅通过 Λ 的样本集合和外在 Wasserstein 距离 W 来学习（Λ，Wλ）的潜在流形结构。特别地，我们展示了度量空间（Λ，Wλ）可以从具有节点 Λ 样本集合和边权重 W (λi, λj) 的图中，按照 Gromov-Wasserstein 的意义上逐渐恢复。此外，我们通过对从 λ 到足够接近和不同的样本 Λ 集合中，使用最优输运映射的合适 “协方差算符” 的谱分析，展示了如何渐近地恢复样本 λ 处的切空间。本文最后给出了一些关于子流形 Λ 的具体构造以及通过谱分析恢复切空间的数值例子。

Nov, 2023

变分 Wasserstein 聚类

本文提出一种基于最优输运的聚类方法，它通过使用变分原理求解最优输运，并研究使用力图来将任意域聚合为固定数量的聚类。通过迭代地将聚类中心驱动到目标域中，并通过调整力图来保持最小聚类能量，从而同时追求聚类和聚类中心与目标域之间的 Wasserstein 距离。作者在合成和真实数据的领域自适应、重新网格化和表示学习方面演示了该方法的应用。

Jun, 2018

使用 Wasserstein 距离度量的分布模板估计

该研究针对比较随机变量分布及定义事件样本的平均模式等问题，使用 Wasserstein 空间的测度重心提出一个迭代版本进行平均分布的估计，并且当分布是由居中随机算子扭曲的常见措施时，则测地线能恢复该分布模板。

Nov, 2011