鲁棒多元均值估计:修剪均值的最优性
本文研究了一个基于迭代重新加权的估计方法,该方法针对多元高斯分布的均值具有鲁棒性,且具有多个优秀性质,包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外,本文还为提出的估计器建立了无维度的非渐近风险界限,并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。
Feb, 2020
基于独立样本,我们尝试估计各种概率分布的共同空间上的多维均值。我们的方法通过凸组合样本的经验均值来形成估计器。我们介绍了两种找到合适的数据依赖凸组合权重的策略:第一种策略利用测试过程识别方差较低的相邻均值,从而得到一个权重的闭式插值公式;第二种策略通过最小化二次风险上界确定权重。通过理论分析,我们评估了我们的方法在二次风险上相对于经验均值的改进。我们的分析集中在维度渐进的角度上,显示我们的方法在数据的有效维度增加时渐进地接近一个理想(极小化)改进。通过在模拟和真实数据集上进行实验,我们展示了我们的方法在估计多核均值嵌入方面的有效性。
Mar, 2024
该论文阐述了在自然情况下改善多项式算法稳健均值估计误差率在计算上可能是不可行的,并探索了改善现有算法的错误率的自然方法,并证明了这将意味着小集合扩展问题的有效算法。
Mar, 2019
对于从共享数据中进行统计学习和分析,在保证隐私和鲁棒性两个主要问题中,PRIME 是第一种同时实现了隐私性和鲁棒性的高效算法,可以应用于广泛的分布。我们还使用了一个新的指数时间算法来提高 PRIME 的样本复杂度,达到接近最优的保证,并与已知的(非鲁棒)私有均值估计的下限相匹配,说明同时保证隐私和鲁棒性不需要额外的统计代价。
Feb, 2021
本研究考虑了独立采样数据的公共平均值估计问题,提出了一种估计器,它能够适应数据异质性的水平,在 i.i.d. 和某些非同质的设置下均达到近似最优,其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器,又利用了新型经验过程理论结果,在多元估计和回归的情况下,我们提出了可在多项式时间内运行的估计器版本。
Jul, 2019
本文研究了概率测度 $P$ 均值的健壮估计量,提出了一种稍微复杂的构造方法以处理健壮 $M$- 估计问题,并将该方法应用于最小二乘密度估计、具有 Kullback 损失的密度估计以及非高斯、不受限制的随机设计和异方差回归问题,同时作者表明该策略也可以用于数据只被假设为混合的情况。
Dec, 2011
研究如何在高维结构化估计中使用强鲁棒技术,包括利用非凸损失函数的修剪版本的结构化规则的 M 估计量,分析它们的统计收敛速率和一致性,并展示了其在基因组数据分析中的表现。
May, 2016
本文提供一个元问题和一个对偶定理,通过这个元问题和对偶定理,我们从新的统一的视角研究了高维健壮统计和重尾分布均值估计问题,并展示了一个既简单又高效的算法,该算法用于处理两个不同问题通过两种算法最终合并实现了 “大同小异”
Jul, 2020
本研究发展了稳健统计中 Huber 的 epsilon 污染模型和重尾噪声模型的连接,并在此基础上提供了一种简单的变体,用于 Huber 模型中的均值估计,同时具有鲁棒性和计算效率。进一步地,我们的算法采用最优统计鲁棒策略,实现了在两个模型中的最优性能表现。在合成数据集上进行实验表明,相对于实际基线方法,我们的方法令人信服地优于多种方法。
Jul, 2019