本文提出一种基于中值的相位恢复算法,可处理包含近似任意值的稀疏异常值数据、采用泊松损失或二次损失函数、证明算法在 i.i.d 高斯测量向量中表现稳健且可根据测量值中异常值的恶意程度恢复信号。
Mar, 2016
本研究考虑了独立采样数据的公共平均值估计问题,提出了一种估计器,它能够适应数据异质性的水平,在 i.i.d. 和某些非同质的设置下均达到近似最优,其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器,又利用了新型经验过程理论结果,在多元估计和回归的情况下,我们提出了可在多项式时间内运行的估计器版本。
Jul, 2019
使用中位数估计器介绍了一种新的鲁棒机器学习估计器,能够在最小数据集假设下实现最佳收敛率,这一方法通过分析异常值而得出。该研究提出一个新的断点概念,该断点数量考虑了估计器的统计性能,同时提高了算法的可实现性。
Nov, 2017
该文提出了一种使用 VC-dimension 的方法来测量统计复杂性的新型通用方法,从而使得 MOM 估计值的超额风险得到限制,其中应用该方法得出的鲁棒稀疏估计器实现了所谓的次高斯速率并且最多只需要假设非污染数据拥有有限的二阶矩。同时,该技术还可用于导出多种新的鲁棒次高斯边界,包括任何范数下的均值估计和协方差估计中的使用。
Apr, 2020
提出了一种在不强加限制性假设的情况下构建协方差估计器的原则方法,通过最小化与接近名义分布的所有数据分布相关的最坏情况 Frobenius 误差来研究分布鲁棒协方差估计问题,证明了鲁棒估计器的有效计算性、渐近一致性和有限样本性能保证,并通过合成 Kullback-Leibler、Fisher-Rao 和 Wasserstein 散度的显式估计器来说明这一通用方法。基于合成和实际数据的数值实验表明,我们的鲁棒估计器与最先进的估计器具有相竞争的性能。
May, 2024
提出一种计算哈达玛空间中几何中心和 Frechet 平均的算法,并从树空间等应用中证明其实用性。
Oct, 2012
本文主要介绍了一种基于近似中位数算法的算法来估算统计数据集的普适性,该算法满足差分隐私的强稳定性保证,解决了统计数据集在自适应问题上的泛化保证的新方法。
Jun, 2017
我们研究了鲁棒均值估计的仿射等价估计器的定量性能,证明仿射等价性会导致恢复误差以一定的因子(sqrt (d))定量恶化,并构建了一种新的近似最优的仿射等价估计器,该估计器基于一种高维中位数的新概念。
Oct, 2023
该研究提出了一种新型的鲁棒梯度下降算法,采用直接对观测值施加平滑的乘性噪声,构建软截断梯度坐标之和的方式,使其具有与传统方法相当的理论保证和更高的数据分布类别广泛性能。
Oct, 2018
通过理论分析、提出半空间方法,更加有效地测量数据集的浓缩程度,从而得到更紧密的原始鲁棒性下限,并证明这些更紧密的下限进一步排除了基于数据集浓缩的假说,该假说被认为是解释现有分类器使之易受到对抗攻击的可能原因。
Mar, 2021