随机向量均值的次高斯估计器
本文从非渐近的角度探讨了从非正态分布中的独立同分布观测中估计实值随机变量均值的可能性和局限性,提出了一些呈现次高斯分布特征的估计器,并证明了几个均值估计器的不可能性结果。
Sep, 2015
本论文利用半定规划松弛和高维中位数,首次提出了一种多项式时间算法,能在有限均值和协方差的假设下估计具有重尾分布的多维随机向量的均值,并实现亚高斯置信区间。
Sep, 2018
提出了一种估计随机向量均值的估计器,时间复杂度为 $O (n^4+n^2d)$,其误差界限符合亚高斯分布。与 Hopkins(2018)介绍的基于二次项和谐级数的多项式时间估计器一样,在具有有限均值和协方差的数据分布方面,效率最高,但运行时间更快,分析更简单。
Feb, 2019
本文介绍了一种基于 Median-of-Means 方法和 Semi-definite Programming 的算法,使用时并不需要先验知识,能够高效处理大数据,包含异常值和重尾数据等,稳定性强,能达到次高斯速率
Jun, 2019
本文研究了一个基于迭代重新加权的估计方法,该方法针对多元高斯分布的均值具有鲁棒性,且具有多个优秀性质,包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外,本文还为提出的估计器建立了无维度的非渐近风险界限,并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。
Feb, 2020
在研究中,我们发现对于任何分布,没有合理的估计器能够在渐近情况下超过次高斯的误差率,匹配最坏情况的结果。我们引入了一个新的定义框架来分析算法的细粒度最优性,称之为 ' 邻域最优性 ',其中介于 ' 实例最优性 ' 和' 可接受性 ' 定义之间。
Nov, 2023
本研究考虑了独立采样数据的公共平均值估计问题,提出了一种估计器,它能够适应数据异质性的水平,在 i.i.d. 和某些非同质的设置下均达到近似最优,其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器,又利用了新型经验过程理论结果,在多元估计和回归的情况下,我们提出了可在多项式时间内运行的估计器版本。
Jul, 2019
该文提出了一种使用 VC-dimension 的方法来测量统计复杂性的新型通用方法,从而使得 MOM 估计值的超额风险得到限制,其中应用该方法得出的鲁棒稀疏估计器实现了所谓的次高斯速率并且最多只需要假设非污染数据拥有有限的二阶矩。同时,该技术还可用于导出多种新的鲁棒次高斯边界,包括任何范数下的均值估计和协方差估计中的使用。
Apr, 2020
研究估计具有有界平均值和协方差的重尾随机向量均值的算法问题,提供了一种基于谱方法的算法来解决该问题,并且只需要计算近似特征向量,取得了最优的统计性能和更快的运行速度。
Aug, 2019
本文研究了概率测度 $P$ 均值的健壮估计量,提出了一种稍微复杂的构造方法以处理健壮 $M$- 估计问题,并将该方法应用于最小二乘密度估计、具有 Kullback 损失的密度估计以及非高斯、不受限制的随机设计和异方差回归问题,同时作者表明该策略也可以用于数据只被假设为混合的情况。
Dec, 2011