对异常数据鲁棒的回归的高效算法
对稳健最小二乘回归(RLSR)中的扰动问题进行研究,提出了一种称为TORRENT的简单硬阈值算法,能够在存在干扰情况下恢复w*,并且能够实现大规模高维度的稀疏恢复。该方法比最先进的L1求解器快20倍以上。
Jun, 2015
通过使用硬阈值化的新颖变体,本文提出了一种快速的鲁棒估计器,可以有效地解决使用响应变量损坏的鲁棒线性回归问题,并通过应用于不同的扰动模型,展示了其估计能力的稳健性。
Mar, 2019
本文研究了在线情况下健壮线性回归问题,提出了一种基于随机梯度下降方法和L1损失函数的高效算法,能够在存在污染数据情况下有效检测和去除异常值,算法复杂度与污染比例相关。
Jul, 2020
本文提出了一种在数据为超收缩分布、存在不可避免的敌对噪声情况下,基于平方和框架的线性模型学习算法,该算法的收敛速度与扰动的比例成幂率关系,能达到理论最优收敛速度且在先前研究中未被发现。
Jun, 2020
本论文研究线性回归问题并提出了一种新的算法,它能够在存在离群值的情况下,对有限矩(至$L_4$)的样本进行最佳的次高斯误差边界估计,并且通过使用谱方法研究了线性回归问题与最远超平面问题之间的关系,同时引入了第三个经验过程进行统计学属性的研究。
Jul, 2020
研究了高维稳健线性回归问题,在受到对抗性破坏的情况下提出了估计方法,包括样本复杂度,恢复保证,运行时间等关键指标,并利用近期算法发展的加速算法和高斯舍入技术等方法来优化估计器的运行时间和统计样本复杂性。
Jul, 2020
探讨了在普通最小二乘回归中,找到或推翻删除数据集中的小子集会反转系数符号的实用算法;通过实证研究了用于此任务的成熟算法技术在一般线性回归问题和特殊情况下的精确贪婪方法方面的性能,证明这些方法在几个维度的回归问题中优于现有技术并提供了实用的鲁棒性检查;但对于维度为 3 或更高的回归问题中推翻这种小型影响样本存在性的重要任务仍存在显著的计算瓶颈;通过使用源自算法稳健统计的最新创新思想的谱算法在这一挑战中取得了一些进展;总结了在几个挑战数据集中,已知技术的限制,以促进进一步的算法创新。
Jul, 2023