ICLROct, 2019

岭回归:结构、交叉验证和草图

TL;DR本文研究岭回归的三个基本问题:估计器结构、正确使用交叉验证选择正则化参数以及如何在不损失过多精度的情况下加速计算。我们在一个统一的大数据线性模型下考虑了这三个问题。通过将岭回归精确表示为真实参数和噪声的协方差矩阵相关的线性组合,我们研究了 $K$- 折交叉验证选择正则化参数的偏差,并提出了一种简单的偏差校正方法。我们分析了原始和对偶草图在岭回归中的准确性,并以模拟和实证数据分析为例说明了我们的结果。