Banach 空间中的几何中位数和鲁棒估计

Aug, 2013

Banach 空间中的几何中位数和鲁棒估计

Geometric median and robust estimation in Banach spaces

Stanislav Minsker

TL;DR当数据受到重尾噪声污染且可能包含大幅度的离群值时，本文介绍了一种通用方法，通过使用 Banach 空间中取值的可靠估计值，使得即使输入包含了已损坏的测量值也能产生可靠结果，并通过几个实例进行了说明，包括稀疏线性回归和低秩矩阵恢复问题。

Abstract

In many real-world applications, collected data are contaminated by noise with heavy-tailed distribution and might contain outliers of large magnitude. In this situation, it is necessary to apply methods which pr

outliers heavy-tailed distribution reliable estimators banach space geometric median

发现论文，激发创造

带有异常值的相位恢复问题中的中位数截断非凸方法

本文提出一种基于中值的相位恢复算法，可处理包含近似任意值的稀疏异常值数据、采用泊松损失或二次损失函数、证明算法在 i.i.d 高斯测量向量中表现稳健且可根据测量值中异常值的恶意程度恢复信号。

Mar, 2016

估计纠缠单样本分布中的位置参数

本研究考虑了独立采样数据的公共平均值估计问题，提出了一种估计器，它能够适应数据异质性的水平，在 i.i.d. 和某些非同质的设置下均达到近似最优，其估计器既考虑了传统统计学中的模态区间、shorth、中位数估计器，又利用了新型经验过程理论结果，在多元估计和回归的情况下，我们提出了可在多项式时间内运行的估计器版本。

Jul, 2019

用平均数中位数保障的机器学习：理论与实践

使用中位数估计器介绍了一种新的鲁棒机器学习估计器，能够在最小数据集假设下实现最佳收敛率，这一方法通过分析异常值而得出。该研究提出一个新的断点概念，该断点数量考虑了估计器的统计性能，同时提高了算法的可实现性。

Nov, 2017

具有 VC 维的鲁棒次高斯估计

该文提出了一种使用 VC-dimension 的方法来测量统计复杂性的新型通用方法，从而使得 MOM 估计值的超额风险得到限制，其中应用该方法得出的鲁棒稀疏估计器实现了所谓的次高斯速率并且最多只需要假设非污染数据拥有有限的二阶矩。同时，该技术还可用于导出多种新的鲁棒次高斯边界，包括任何范数下的均值估计和协方差估计中的使用。

Apr, 2020

通过扩大模糊集合缩小谱值：一种分布鲁棒协方差估计的几何统一

提出了一种在不强加限制性假设的情况下构建协方差估计器的原则方法，通过最小化与接近名义分布的所有数据分布相关的最坏情况 Frobenius 误差来研究分布鲁棒协方差估计问题，证明了鲁棒估计器的有效计算性、渐近一致性和有限样本性能保证，并通过合成 Kullback-Leibler、Fisher-Rao 和 Wasserstein 散度的显式估计器来说明这一通用方法。基于合成和实际数据的数值实验表明，我们的鲁棒估计器与最先进的估计器具有相竞争的性能。

May, 2024

在 Hadamard 空间中计算中位数和平均值

提出一种计算哈达玛空间中几何中心和 Frechet 平均的算法，并从树空间等应用中证明其实用性。

Oct, 2012

基于稳定中位数的自适应估计器泛化

本文主要介绍了一种基于近似中位数算法的算法来估算统计数据集的普适性，该算法满足差分隐私的强稳定性保证，解决了统计数据集在自适应问题上的泛化保证的新方法。

Jun, 2017

仿射等变估计的统计屏障

我们研究了鲁棒均值估计的仿射等价估计器的定量性能，证明仿射等价性会导致恢复误差以一定的因子（sqrt (d)）定量恶化，并构建了一种新的近似最优的仿射等价估计器，该估计器基于一种高维中位数的新概念。

Oct, 2023

利用平滑乘法噪音的鲁棒下降

该研究提出了一种新型的鲁棒梯度下降算法，采用直接对观测值施加平滑的乘性噪声，构建软截断梯度坐标之和的方式，使其具有与传统方法相当的理论保证和更高的数据分布类别广泛性能。

Oct, 2018

利用半空间在 $l_p$- 范数距离度量下改进浓度估计

通过理论分析、提出半空间方法，更加有效地测量数据集的浓缩程度，从而得到更紧密的原始鲁棒性下限，并证明这些更紧密的下限进一步排除了基于数据集浓缩的假说，该假说被认为是解释现有分类器使之易受到对抗攻击的可能原因。

Mar, 2021