当恶意异常值污染标签时，ERM 和 RERM 是回归问题的最优估计器

Oct, 2019

当恶意异常值污染标签时，ERM 和 RERM 是回归问题的最优估计器

ERM and RERM are optimal estimators for regression problems when malicious outliers corrupt the labels

Geoffrey Chinot

TL;DR本文研究了具有凸且 L-Lipschitz 损失函数的回归问题的经验风险最小化器（ERM）和正则化经验风险最小化器（RERM）。结果可用于许多非正则化和正则化过程，在噪声较弱的情况下为赫伯的 M - 估计量（没有惩罚项或由 L1 范数进行正则化）和在可重现内积希尔伯特空间中的一般正则化学习问题提供结果，噪声可以是重尾的。

Abstract

We study empirical risk minimizers (ERM) and Regularized Empirical Risk Minimizers (RERM) for regression problems with convex and $L$-Lipschitz loss functions. We consider a setting where $|\cO|$ malicious outliers

empirical risk minimizers regularized empirical risk minimizers malicious outliers huber's m-estimators reproducible kernel hilbert spaces

发现论文，激发创造

在存在异常值的情况下，鲁棒性经验风险最小化性能的渐近特征

本文研究高维度的鲁棒线性回归，包括离群值和使用标准损失函数的经验风险最小化（ERMs）方法。结果显示，在相似数据集上，经过最优正则化的 ERM 在大样本复杂性极限下是渐近一致的，但在评估误差方面，由于规范标定的失配，估计器的一致性要求完美计算最优规范的预估值或存在未受离群值污染的交叉验证集。不同的损失函数在最优性能的使用情况下提供了有关使用情况的见解。

May, 2023

高维岭回归经验风险最小化的基本限制

本文首次表征凸形 ERM 在高维广义线性模型推断中的基本统计精度界限，推导出任意损失函数和正则化参数值的紧凑下界，并精确评价了损失函数和正则化参数值的优化调整。

Jun, 2020

重新审视差分隐私的经验风险最小化问题：更快且更广泛

本文研究不同设置下差分隐私经验风险最小化问题，提出了比以前更少的梯度复杂度的算法，并从凸损失函数推广到满足 Polyak-Lojasiewicz 条件的非凸函数，给出比传统算法更紧的上界。

Feb, 2018

超出最坏情况的私有经验风险最小化：约束集几何形状的影响

本文介绍了隐私保护数据集下 Empirical Risk Minimization（ERM）的改进算法 —— 不同 ially private ERM Algorithm。该算法通过利用限制条件的几何特性，在 Lipschitz、强凸和光滑函数等情况下，提供了更严格的误差上界，并针对稀疏线性回归（LASSO）提出了新的下界。

Nov, 2014

论经验风险最小化的方差、可接受性和稳定性

本文研究了 Empirical Risk Minimization 在最小化最大化次优误差率下的偏差和方差分解问题，证明了在偏差方面，ERB 存在明显缺陷。同时，文中探讨了 ERM 的可接受性定理，并扩展到固定设计和随机设计的各种模型中。最后，提出了 ERM 的稳定性，以及一定条件下 ERM 的近似极小化不足的情况。

May, 2023

差分隐私的非交互式局部模型中的经验风险最小化

本文研究了在非交互式局部差分隐私（LDP）模型下经验风险最小化（ERM）问题，利用 Bernstein 多项式逼近方法和内积多项式逼近技术提出了两种解决高维数据下样本复杂度指数级上升的方法，最终提出了用于学习 k 维边际查询和平滑查询的（高效的）非交互式局部差分隐私算法。

Nov, 2020

关于平滑数据的经验风险最小化性能

经验风险最小化算法（ERM）在已知数据集且平滑的情况下，能够实现次线性误差，并且具有统计复杂性的概念。

Feb, 2024

倾斜的经验风险最小化

本文提出了一种名为 tilted empirical risk minimization (TERM) 的新框架，通过引入一个称之为 tilt 的超参数，它能够灵活调整每个个体损失的影响，以实现对离群点的鲁棒性或公平性，同时具有减少方差，促进泛化和处理类别不平衡的能力。我们通过发展批和随机一阶优化方法来解决 TERM 问题，并证明它相对于常见的替代方案，能够高效地解决这个问题。除了在现有解决方案这些问题，提出方案竞争力之外，我们还将 TERM 用于多种应用，如在亚组之间实施公平性，减轻离群值的影响以及处理类别失衡问题。

Jul, 2020

经验熵、最小化后悔和最小化风险

关于随机设计回归模型的统计学习研究，我们提出了一种聚合经验最小值的方法，并建立了其风险的尖锐 Oracle 不等式，进一步证明了在良好规定的模型下，统计估计和在错误规定的模型下的统计后悔的速率等价的结论。

Aug, 2013

在单次遍历中与经验风险最小化器竞争

本文提出了一种流式算法，可以在一次样本遍历中，线性时间内实现并且使用的空间仅为每个样本大小的线性。算法能够在每个问题上达到与 $ERM$ 相同的统计收敛速率，甚至考虑常数因素，而且算法性能随初始误差下降的超多项式速率，算法易于并行。此外，本文量化了算法与 $ERM$ 竞争的（有限样本）速度。

Dec, 2014