自适应 Wasserstein 距离中的过程估计
本研究介绍了不同学者对于随机过程的拓扑结构方面的探究,其中包含对预测过程、信息拓扑、扩散过程中引入的 Wasserstein 距离和嵌套距离等的介绍,并研究这些方法建立的拓扑结构与优化问题的关联。主要发现是这些方法定义了有限离散时间内相同的拓扑结构,并且该弱自适应拓扑结构是连续的有界奖励函数的最佳停止问题的最粗拓扑结构。
May, 2019
通过随机目标函数的线性规划问题,实现有限点概率分布的经验 Wasserstein 距离的渐近分布,以方便进行统计推断(例如,基于样本的 Wasserstein 距离的置信区间);该结果基于定向 Hadarmard 可微性,证明了经典引导法及其替代方法的失败。同时,该分布特性在两个数据集上得到了证明其实用性的验证。
Oct, 2016
本文研究 Wasserstein 距离的问题,得出了关于概率测度的收敛速度的渐近结果和有限样本结果。结果表明,随着样本量 $n$ 的增加,测度可以呈现出不同的收敛速度。
Jul, 2017
本文提出了一种新的统计模型 —— 尖峰运输模型,该模型规范化了两个概率分布仅在低维子空间上不同的假设。我们研究了在这个模型下 Wasserstein 距离的最小二乘率,并表明这种低维结构可以避免维度灾难。通过最小二乘分析,我们得出了一个下界,表明在缺少这样的结构的情况下,插值估计量在高维度中几乎是最优的。我们还提供了统计和计算难度之间的差距的证据,并猜测任何计算上有效的估计量注定受到维数灾难的影响。
Sep, 2019
本文提出一种泛化近期针对有限维欧几里得空间和有界函数空间的结果的,衡量概率测度和其经验版本之间期望 Wasserstein 距离的上界方法,并将其推广到具有大维度的欧几里得空间及分离的 Hilbert 空间中的 Gaussian process。此外,结合均值集中结果,给出了 Bernstein 型或 log Sobolev 型条件下,经验测度的 Wasserstein 误差的改进指数尾部概率界。
Apr, 2018
该研究探讨了高斯样本经验分布之间的 Wasserstein 距离的中心极限定理,提出了根据 Wasserstein 距离在高斯样本中的自由勒什特可微性进行区分的方法,并讨论了对椭圆对称分布的扩展以及引导重抽样和统计检验等若干应用。
Jul, 2015
本文研究表明多个机器学习评估器,包括平方根 LASSO 和正则化逻辑回归,可以表示为分布鲁棒优化问题的解决方案,其相关的不确定区域基于适当定义的 Wasserstein 距离。因此,我们的表示使我们能够将正则化视为引入人为对手的结果,该对手扰动经验分布以考虑损失估计中的样外效应。此外,我们引入了 RWPI(Robust Wasserstein Profile Inference),这是一种新颖的推断方法,它将启发式似然性方法的使用扩展到最优传输成本的设置中(其中 Wasserstein 距离是一个特殊情况)。我们使用 RWPI 展示如何最优地选择不确定性区域的大小,从而能够选择这些机器学习评估器的正则化参数,而不使用交叉验证。数值实验也给出了验证我们理论发现的结果。
Oct, 2016
本文构建了一个新的随机概率度量空间,并使用相对熵函数作为 Hamiltonian,使其在球面和单位区间上都具有 Gibbs 结构。我们利用其积分换先公式,通过 Dirichlet 形式方法构建了两类概率度量空间上的扩散过程,第一类与 Malliavin 的 Brownian motion 密切相关,第二类是热流的概率值随机扰动,其内部度量是二次 Wasserstein 距离,可视为 Wasserstein 空间上的经典扩散过程。
Apr, 2007
使用 Wasserstein 距离对分布进行差分私密密度估计,并设计了可以适应简单实例的实例最优算法,对于特殊情况下的离散分布,结果还导致了 TV 距离下的实例最优私密学习。
Jun, 2024