基于 PAC-Bayes bounds 的新 M-estimators 方法在随机变量具有有界方差和有界峰度或者仅有界方差的情况下具有非渐进极小方差偏差特性,在分布为重尾分布的情况下,其对某个置信度水平的偏差与统计样本的经验均值的偏差的顺序相同。
Sep, 2010
本文从非渐近的角度探讨了从非正态分布中的独立同分布观测中估计实值随机变量均值的可能性和局限性,提出了一些呈现次高斯分布特征的估计器,并证明了几个均值估计器的不可能性结果。
Sep, 2015
本文研究了一个基于迭代重新加权的估计方法,该方法针对多元高斯分布的均值具有鲁棒性,且具有多个优秀性质,包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外,本文还为提出的估计器建立了无维度的非渐近风险界限,并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。
Feb, 2020
该论文阐述了在自然情况下改善多项式算法稳健均值估计误差率在计算上可能是不可行的,并探索了改善现有算法的错误率的自然方法,并证明了这将意味着小集合扩展问题的有效算法。
Mar, 2019
本文研究了经验风险极小化算法的鲁棒版本,提出了基于代理替换的统计方法,以解决样本中存在离群值的情况,并且在回归问题上的表现得到了检验。
Oct, 2019
本研究考虑了独立采样数据的公共平均值估计问题,提出了一种估计器,它能够适应数据异质性的水平,在 i.i.d. 和某些非同质的设置下均达到近似最优,其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器,又利用了新型经验过程理论结果,在多元估计和回归的情况下,我们提出了可在多项式时间内运行的估计器版本。
Jul, 2019
探讨了基于 Catoni 均值估计的经验风险最小化问题,并发展了基于 Catoni 的均值估计器的链式论据性能界限,以应对损失函数不一定有界,可能具有重尾分布的情况。
Jun, 2014
本研究发展了稳健统计中 Huber 的 epsilon 污染模型和重尾噪声模型的连接,并在此基础上提供了一种简单的变体,用于 Huber 模型中的均值估计,同时具有鲁棒性和计算效率。进一步地,我们的算法采用最优统计鲁棒策略,实现了在两个模型中的最优性能表现。在合成数据集上进行实验表明,相对于实际基线方法,我们的方法令人信服地优于多种方法。
基于独立样本,我们尝试估计各种概率分布的共同空间上的多维均值。我们的方法通过凸组合样本的经验均值来形成估计器。我们介绍了两种找到合适的数据依赖凸组合权重的策略:第一种策略利用测试过程识别方差较低的相邻均值,从而得到一个权重的闭式插值公式;第二种策略通过最小化二次风险上界确定权重。通过理论分析,我们评估了我们的方法在二次风险上相对于经验均值的改进。我们的分析集中在维度渐进的角度上,显示我们的方法在数据的有效维度增加时渐进地接近一个理想(极小化)改进。通过在模拟和真实数据集上进行实验,我们展示了我们的方法在估计多核均值嵌入方面的有效性。
Mar, 2024
本文研究了基于经验似然和分布鲁棒解的方法进行随机优化问题的统计推断,特别关注最优值的置信区间和渐近达到精确覆盖的解决方案。我们提出了一个基于非参数 $f$- 分歧球构建的分布不确定性集合的广义经验似然框架,用于 Hadamard 可微函数和随机优化问题,从而提供了一个有原则的选择分布不确定性区域大小的方法,以实现达到精确覆盖的单侧和双侧置信区间。我们还给出了我们分布鲁棒的公式的渐近展开,表明如何通过方差来规范化问题。最后,我们证明了,我们研究的分布鲁棒公式的优化器具有与经典样本平均逼近中的优化器基本相同的一致性属性。我们的一般方法适用于快速混合的平稳序列,包括几何上遗传的 Harris 递归马尔科夫链。
Oct, 2016