广义韧性与健壮统计学
本文研究了基于经验似然和分布鲁棒解的方法进行随机优化问题的统计推断,特别关注最优值的置信区间和渐近达到精确覆盖的解决方案。我们提出了一个基于非参数 $f$- 分歧球构建的分布不确定性集合的广义经验似然框架,用于 Hadamard 可微函数和随机优化问题,从而提供了一个有原则的选择分布不确定性区域大小的方法,以实现达到精确覆盖的单侧和双侧置信区间。我们还给出了我们分布鲁棒的公式的渐近展开,表明如何通过方差来规范化问题。最后,我们证明了,我们研究的分布鲁棒公式的优化器具有与经典样本平均逼近中的优化器基本相同的一致性属性。我们的一般方法适用于快速混合的平稳序列,包括几何上遗传的 Harris 递归马尔科夫链。
Oct, 2016
分布变化是现代统计学习中的一个严重问题,我们研究了 Wasserstein 分布变化以及联合分布变化,分析了一些重要的统计问题,包括位置估计、线性回归和非参数密度估计。对于均值估计和线性回归的预测误差,我们找到了最小二乘风险和最不利扰动,并证明了样本均值和最小二乘估计量分别是最优的。对于其他问题,我们提供了几乎最优的估计器和精确的有限样本界限。我们还引入了几种用于边界化分布变化的最小风险的工具,如平滑技术、最不利优先级序列的推广以及 Le Cam、Fano 和 Assouad 方法的泛化。
Aug, 2023
本研究表明,Wasserstein 分布鲁棒估计器的推广保证其可适用于一般模型类,并且不会受到维度诅咒,甚至可以涵盖测试中的分布偏移,这些结果可以延伸到新引入的 Wasserstein 分布性机器学习问题的正则化版本。
May, 2023
研究了采用分布鲁棒优化方法(distributionally robust optimization,DRO)来推断个性化治疗规则(individualized treatment rules,ITRs)的估计器在新设置中的应用,包括 Wasserstein distance-based ambiguity characterizations 和其在目标人群中的理论表现的评估。这个方法在目标人群中优于传统的策略。
May, 2022
该论文介绍了一种通过使用分布模型以及多项式时间算法在高维数据中实现鲁棒性估计的方法,并且提出了优化方法,以使算法能够适应更多的数据异常值,实现更高效的鲁棒性估计。
Mar, 2017
本论文基于 Wasserstein 空间的球体不确定性集合,提出了用于统计学习的极小极大框架,并证明了涉及原始极大似然问题的覆盖数特性的一般化界限。 作为一个具体的例子,我们为基于传输的域自适应问题提供了推广保证,其中源域和目标域分布之间的 Wasserstein 距离可以可靠地从未标记样本中估算。
May, 2017
本文提出了一种使用 Wasserstein 距离构建概率分布空间球体,并在此基础上最小化包含了经典和常见正则化逻辑回归的最坏情况期望对数损失函数的鲁棒分布逻辑回归模型,同时使用基于 Wasserstein 球的分布鲁棒方法计算分类器误分类概率的置信度上下边界。
Sep, 2015