当恶意异常值污染标签时,ERM 和 RERM 是回归问题的最优估计器
本文研究高维度的鲁棒线性回归,包括离群值和使用标准损失函数的经验风险最小化(ERMs)方法。结果显示,在相似数据集上,经过最优正则化的 ERM 在大样本复杂性极限下是渐近一致的,但在评估误差方面,由于规范标定的失配,估计器的一致性要求完美计算最优规范的预估值或存在未受离群值污染的交叉验证集。不同的损失函数在最优性能的使用情况下提供了有关使用情况的见解。
May, 2023
本文首次表征凸形 ERM 在高维广义线性模型推断中的基本统计精度界限,推导出任意损失函数和正则化参数值的紧凑下界,并精确评价了损失函数和正则化参数值的优化调整。
Jun, 2020
本文研究不同设置下差分隐私经验风险最小化问题,提出了比以前更少的梯度复杂度的算法,并从凸损失函数推广到满足 Polyak-Lojasiewicz 条件的非凸函数,给出比传统算法更紧的上界。
Feb, 2018
本文介绍了隐私保护数据集下 Empirical Risk Minimization(ERM)的改进算法 —— 不同 ially private ERM Algorithm。该算法通过利用限制条件的几何特性,在 Lipschitz、强凸和光滑函数等情况下,提供了更严格的误差上界,并针对稀疏线性回归(LASSO)提出了新的下界。
Nov, 2014
本文研究了 Empirical Risk Minimization 在最小化最大化次优误差率下的偏差和方差分解问题,证明了在偏差方面,ERB 存在明显缺陷。同时,文中探讨了 ERM 的可接受性定理,并扩展到固定设计和随机设计的各种模型中。最后,提出了 ERM 的稳定性,以及一定条件下 ERM 的近似极小化不足的情况。
May, 2023
本文研究了在非交互式局部差分隐私(LDP)模型下经验风险最小化(ERM)问题,利用 Bernstein 多项式逼近方法和内积多项式逼近技术提出了两种解决高维数据下样本复杂度指数级上升的方法,最终提出了用于学习 k 维边际查询和平滑查询的(高效的)非交互式局部差分隐私算法。
Nov, 2020
本文提出了一种名为 tilted empirical risk minimization (TERM) 的新框架,通过引入一个称之为 tilt 的超参数,它能够灵活调整每个个体损失的影响,以实现对离群点的鲁棒性或公平性,同时具有减少方差,促进泛化和处理类别不平衡的能力。我们通过发展批和随机一阶优化方法来解决 TERM 问题,并证明它相对于常见的替代方案,能够高效地解决这个问题。除了在现有解决方案这些问题,提出方案竞争力之外,我们还将 TERM 用于多种应用,如在亚组之间实施公平性,减轻离群值的影响以及处理类别失衡问题。
Jul, 2020
关于随机设计回归模型的统计学习研究,我们提出了一种聚合经验最小值的方法,并建立了其风险的尖锐 Oracle 不等式,进一步证明了在良好规定的模型下,统计估计和在错误规定的模型下的统计后悔的速率等价的结论。
Aug, 2013
本文提出了一种流式算法,可以在一次样本遍历中,线性时间内实现并且使用的空间仅为每个样本大小的线性。算法能够在每个问题上达到与 $ERM$ 相同的统计收敛速率,甚至考虑常数因素,而且算法性能随初始误差下降的超多项式速率,算法易于并行。此外,本文量化了算法与 $ERM$ 竞争的(有限样本)速度。
Dec, 2014