仿射等变估计的统计屏障
本文研究了一个基于迭代重新加权的估计方法,该方法针对多元高斯分布的均值具有鲁棒性,且具有多个优秀性质,包括计算上的可行性、对平移、伸缩和正交变换的不变性、高断点以及渐近有效性。此外,本文还为提出的估计器建立了无维度的非渐近风险界限,并将结果推广到了子高斯分布和污染率未知、协方差矩阵未知等情形。
Feb, 2020
当数据受到重尾噪声污染且可能包含大幅度的离群值时,本文介绍了一种通用方法,通过使用 Banach 空间中取值的可靠估计值,使得即使输入包含了已损坏的测量值也能产生可靠结果,并通过几个实例进行了说明,包括稀疏线性回归和低秩矩阵恢复问题。
Aug, 2013
研究怎样在不假设样本的基础分布为高斯分布的前提下,只假定有限个矩的情况下,有效地进行线性回归和协方差估计,并关注能用多少样本来实现高精度和指数级成功概率。使用八阶圆当量半定规划提供算法,预备性的证据表明在我们的算法使用的平均中位数框架中无法在多项式时间内改善这些误差率。
Dec, 2019
研究表明,在许多鲁棒性估计问题中,即使基础优化问题是非凸的,这些问题也能够有效地解决。研究这些鲁棒性估计问题的损失景观,并确定了存在 “广义拟梯度” 的情况。对于分布的鲁棒均值估计,我们证明了一阶稳定点是近似全局最小值,如果损坏水平小于 $1/3$;对于其他任务,包括线性回归和联合均值和协方差估计,我们显示了广义拟梯度的存在,并构建了有效的算法。
May, 2020
提出了一种在不强加限制性假设的情况下构建协方差估计器的原则方法,通过最小化与接近名义分布的所有数据分布相关的最坏情况 Frobenius 误差来研究分布鲁棒协方差估计问题,证明了鲁棒估计器的有效计算性、渐近一致性和有限样本性能保证,并通过合成 Kullback-Leibler、Fisher-Rao 和 Wasserstein 散度的显式估计器来说明这一通用方法。基于合成和实际数据的数值实验表明,我们的鲁棒估计器与最先进的估计器具有相竞争的性能。
May, 2024
提出了一种新的框架,以将鲁棒性的凸松弛算法修改为满足适当参数规范的强最坏情况稳定性保证。通过这一框架,提出了一个可以在存在恶意数据干扰下实现微分隐私的高阶矩的鲁棒估计的算法,包括均值和协方差的估计。该算法成功地应用于成族分布,并在适当参数范数下提供恢复和维度参数的从容保证。
Dec, 2021
本文针对高维下平均数估计的稳健模型、对抗性污染和相应算法进行研究,提出了一种基于当前猜测值参数化的 SDP 族的自然算法,并经证明该算法在次线性时间内逼近真实平均数并达到了理论误差的信息论最优解,同时认为该算法还能进一步实现高维稳健学习问题的次线性时间算法。
Nov, 2018
本研究发展了稳健统计中 Huber 的 epsilon 污染模型和重尾噪声模型的连接,并在此基础上提供了一种简单的变体,用于 Huber 模型中的均值估计,同时具有鲁棒性和计算效率。进一步地,我们的算法采用最优统计鲁棒策略,实现了在两个模型中的最优性能表现。在合成数据集上进行实验表明,相对于实际基线方法,我们的方法令人信服地优于多种方法。
Jul, 2019
本文提供一个元问题和一个对偶定理,通过这个元问题和对偶定理,我们从新的统一的视角研究了高维健壮统计和重尾分布均值估计问题,并展示了一个既简单又高效的算法,该算法用于处理两个不同问题通过两种算法最终合并实现了 “大同小异”
Jul, 2020
研究分布鲁棒平均误差估计问题,提出分布鲁棒 Kalman 滤波器以对抗模型风险,使用非凸的 Wasserstein 不确定性集合中的正态分布,通过可行的凸规划以 Frank-Wolfe 算法计算方向搜索子问题的解。我们展示了最优估计器和最不利分布构成了一种纳什均衡。
Sep, 2018