本文通过隐函数定理和 Monte Carlo 模拟的方法,证明了针对有限度量空间上概率分布的经验正则化最优传输距离,尤其是 Sinkhorn 散度的极限分布为高斯分布,同时说明 Bootstrap 方法的一致性,证明了该结论的计算和统计学应用。
Oct, 2018
本文提出了一种使用 Wasserstein 距离构建概率分布空间球体,并在此基础上最小化包含了经典和常见正则化逻辑回归的最坏情况期望对数损失函数的鲁棒分布逻辑回归模型,同时使用基于 Wasserstein 球的分布鲁棒方法计算分类器误分类概率的置信度上下边界。
Sep, 2015
本文提出了一种方法来计算特定概率模型下利益期望,并给出了为不同的概率模型设置偏差范围的基于最优输运的度量方法,同时应用于风险分析。
Apr, 2016
本文通过理论分析,在高维数据考虑时,通过经验风险最小化框架的分类性能,针对两类高斯混合问题,提出了精确的分类误差预测,并且提出了在岭正则化和非正则化的情况下,都采用简单的平方损失作为高维分类的最优选择。
May, 2019
探讨关于对抗性样本的问题,提出一种基于运输成本不确定性集合的正则化方法,实现了对 Lipschitz 正则化模型的稳健性证明,揭示了对抗学习和分布鲁棒性之间的联系,并提供了对核分类器的 Lipschitz 正则化方法。
Feb, 2020
通过使用分布鲁棒优化和 Owen 的经验似然的技术,我们开发了一种风险最小化和随机优化的方法,提供了一个凸代理来实现方差的降低,实现了近乎最优和计算效率之间的权衡,我们给出了一些有限样本和渐近结果来表征估计器的理论性能。
Oct, 2016
本文研究了机器学习分类器对抗样本(躲避攻击)的鲁棒性,使用最优传输来表征在这一场景下可能的最小损失。作者应用该框架研究了高斯数据的情况,并探究了鲁棒性训练神经网络在 MNIST、Fashion MNIST 和 CIFAR-10 数据集上的最优分类性能与实际性能间的差距。
Sep, 2019
在分布鲁棒学习中,我们引入了基于对抗性矩违规的新的极小极大目标,并展示了通过最小化该目标等效于最小化与真实条件期望的最坏情况下的 $l_2$ 距离,从而在计算成本上提供了大体量的经验性节省。
May, 2024
本文研究了分布回归问题,提出了一种基于再生核希尔伯特空间的简单分析计算的岭回归方法,证明了该方法在两阶段抽样设置下是一致的,并且该估算器能够达到一阶段最小化最优速率。
Nov, 2014
本论文基于 Wasserstein 空间的球体不确定性集合,提出了用于统计学习的极小极大框架,并证明了涉及原始极大似然问题的覆盖数特性的一般化界限。 作为一个具体的例子,我们为基于传输的域自适应问题提供了推广保证,其中源域和目标域分布之间的 Wasserstein 距离可以可靠地从未标记样本中估算。
May, 2017