广义韧性与健壮统计学

Sep, 2019

Generalized Resilience and Robust Statistics

Banghua Zhu, Jiantao Jiao, Jacob Steinhardt

TL;DR通过在任意 Wasserstein 距离下考虑扰动，实现鲁棒统计推断的推广。在这种情况下，我们首次证明了一个称为广义弹性的性质，并通过 Moment 或超对交条件证明了这种弹性的有效性。最后，我们提供了两种设计具有良好有限样本速率的 MD 估计器的不同方法，包括弱化差异和扩展分布集的方法，回顾了与 GAN 领域最近相关的研究结果。

Abstract

robust statistics traditionally focuses on outliers, or perturbations in total variation distance. However, a dataset could be corrupted in many other ways, such as systematic measurement errors and missing covariates. We generalize the →

robust statistics wasserstein distance resilience property minimum distance functionals generative adversarial networks

发现论文，激发创造

弹性：在任意异常值存在情况下进行学习的标准

引入鲁棒性标准使属性的计算更加稳健，包括鲁棒分布学习、鲁棒估计碰巧矩阵模型和鲁棒均值估计，提供新的信息论和算法结果。

Mar, 2017

具有局部和全局对抗性破坏的强健分布学习

在对抗性环境中，考虑利用计算上高效的估计器最小化 Wasserstein 距离，并开发具有有界误差的有限样本算法，用于鲁棒性随机优化。

Jun, 2024

鲁棒优化的统计学：一种广义经验似然方法

本文研究了基于经验似然和分布鲁棒解的方法进行随机优化问题的统计推断，特别关注最优值的置信区间和渐近达到精确覆盖的解决方案。我们提出了一个基于非参数 $f$- 分歧球构建的分布不确定性集合的广义经验似然框架，用于 Hadamard 可微函数和随机优化问题，从而提供了一个有原则的选择分布不确定性区域大小的方法，以实现达到精确覆盖的单侧和双侧置信区间。我们还给出了我们分布鲁棒的公式的渐近展开，表明如何通过方差来规范化问题。最后，我们证明了，我们研究的分布鲁棒公式的优化器具有与经典样本平均逼近中的优化器基本相同的一致性属性。我们的一般方法适用于快速混合的平稳序列，包括几何上遗传的 Harris 递归马尔科夫链。

Oct, 2016

分布偏移下的统计估计：Wasserstein 扰动和极小化理论

分布变化是现代统计学习中的一个严重问题，我们研究了 Wasserstein 分布变化以及联合分布变化，分析了一些重要的统计问题，包括位置估计、线性回归和非参数密度估计。对于均值估计和线性回归的预测误差，我们找到了最小二乘风险和最不利扰动，并证明了样本均值和最小二乘估计量分别是最优的。对于其他问题，我们提供了几乎最优的估计器和精确的有限样本界限。我们还引入了几种用于边界化分布变化的最小风险的工具，如平滑技术、最不利优先级序列的推广以及 Le Cam、Fano 和 Assouad 方法的泛化。

Aug, 2023

（正则化的）Wasserstein 鲁棒分布模型精确泛化保证

本研究表明，Wasserstein 分布鲁棒估计器的推广保证其可适用于一般模型类，并且不会受到维度诅咒，甚至可以涵盖测试中的分布偏移，这些结果可以延伸到新引入的 Wasserstein 分布性机器学习问题的正则化版本。

May, 2023

基于 Wasserstein 距离的分布鲁棒策略学习

研究了采用分布鲁棒优化方法（distributionally robust optimization，DRO）来推断个性化治疗规则（individualized treatment rules，ITRs）的估计器在新设置中的应用，包括 Wasserstein distance-based ambiguity characterizations 和其在目标人群中的理论表现的评估。这个方法在目标人群中优于传统的策略。

May, 2022

高维度下的鲁棒性对实际应用有益

该论文介绍了一种通过使用分布模型以及多项式时间算法在高维数据中实现鲁棒性估计的方法，并且提出了优化方法，以使算法能够适应更多的数据异常值，实现更高效的鲁棒性估计。

Mar, 2017

使用 Wasserstein 距离进行极小极大统计学习

本论文基于 Wasserstein 空间的球体不确定性集合，提出了用于统计学习的极小极大框架，并证明了涉及原始极大似然问题的覆盖数特性的一般化界限。作为一个具体的例子，我们为基于传输的域自适应问题提供了推广保证，其中源域和目标域分布之间的 Wasserstein 距离可以可靠地从未标记样本中估算。

May, 2017

分布鲁棒性逻辑回归

本文提出了一种使用 Wasserstein 距离构建概率分布空间球体，并在此基础上最小化包含了经典和常见正则化逻辑回归的最坏情况期望对数损失函数的鲁棒分布逻辑回归模型，同时使用基于 Wasserstein 球的分布鲁棒方法计算分类器误分类概率的置信度上下边界。

Sep, 2015

算法高维鲁棒统计的最新进展

本文章讨论了高维数据的鲁棒性估计问题以及最近在该领域中提出的算法技术，尤其关注于鲁棒均值估计。

Nov, 2019