本文探讨了在概率测度空间 P(X)中,使用最优传输(Wasserstein)几何将被限制为该度量下的测地线段的曲线,以高效地总结该系列测度。我们展示了在最优传输几何中,重要概念可以通过使用 Wasserstein 平均值和微分几何,找到自然的等效物。然而,应用这些想法是具有挑战性的。为了处理数千个测度和实现可扩放的算法,我们建议使用放松的测地线定义和正则化的最优传输距离。本文的方法在将图像视为形状或颜色直方图方面具有重要意义。
Jun, 2015
本文介绍了 Wasserstein 距离作为概率分布度量的数学概念,以及其在统计学中的重要应用,包括了弱收敛、矩收敛、概率分布扰动等内容。
Jun, 2018
本文研究了 Wasserstein 空间中随机概率测度的重心。利用对偶论证方法,我们对具有紧支撑随机概率测度的各种参数类别的人口重心进行了精确的描述。特别地,我们将 Agueh 和 Carlier(2011)中引入的水斯坦空间中的平均和固定参考测度相对于最优传输映射的期望联系起来。我们还讨论了这种方法在信号和图像处理的可变形模型分析中的有用性。 在这种情况下,我们也考虑从 n 个独立且同分布的随机概率测度中估计人口重心的问题。
Dec, 2012
此研究介绍了一种基于 Wasserstein 距离的方法,用于高维数问题中的 Gaussian 混合模型的优化问题,并讨论了它的性质和在图像处理中的应用。
Jul, 2019
本文研究了 Wasserstein barycenters 在离散情况下的理论结果和应用,揭示了离散 Wasserstein barycenters 必须也是离散度量,且有可证明的稀疏驻点,同时提供了一个固定货物和不同需求分布情况下的最优库存分布的 proof-of-concept 计算方法。
Jul, 2015
介绍了在具有有限二阶矩的线上概率测度空间中引入测地线主成分分析(GPCA)的方法,并探讨了该方法相对于概率密度的标准功能主成分分析的优势。使用实例说明该方法在数据分析方面的优点,同时应用于人口金字塔的真实数据集。
Jul, 2013
本文通过随机算法来计算具有 Wasserstein 距离下的一组概率分布的重心,该方法不同于以往的方法,可以适用于连续输入分布,并允许在每个迭代中调整重心的支持,该算法能够恢复出一个锐利的输出,其支持集合包含在真实重心的支持集合内,并能在一些例子中恢复出比以前更有意义的重心。该方法具有广泛的适用性,可扩展到生成给定分布的超级样本和恢复蓝噪声近似等应用。
Feb, 2018
使用本地 PCA 算法估计嵌入的欧几里得空间中光滑紧致亚流形的维数和正切空间需要的样本点数具有数学严格的上界,该估计考虑了非均匀数据分布和可能跨越亚流形变化的噪声,并允许在多个点上同时进行估计。
Oct, 2021
通过随机目标函数的线性规划问题,实现有限点概率分布的经验 Wasserstein 距离的渐近分布,以方便进行统计推断(例如,基于样本的 Wasserstein 距离的置信区间);该结果基于定向 Hadarmard 可微性,证明了经典引导法及其替代方法的失败。同时,该分布特性在两个数据集上得到了证明其实用性的验证。
Oct, 2016
该研究针对比较随机变量分布及定义事件样本的平均模式等问题,使用 Wasserstein 空间的测度重心提出一个迭代版本进行平均分布的估计,并且当分布是由居中随机算子扭曲的常见措施时,则测地线能恢复该分布模板。
Nov, 2011