Mar, 2020

随机梯度流对最小二乘隐式正则化

TL;DR研究隐式正则化的小批量随机梯度下降,以最小二乘回归为基础问题,利用具有与随机梯度下降相同矩的连续时间随机微分方程,称为随机梯度流。给出了随时间t随机梯度流的超额风险的界限,超过了具有调整参数λ=1/t的岭回归,此界限可以从明确的常数(例如小批量大小,步长,迭代次数)计算出来,显示了这些数量如何精确地推动超额风险。数值实验表明,边界可以很小,表明两种估计值之间存在紧密关系。给出了一个类似的结果,将随机梯度流和岭的系数联系起来。这些结果不受数据矩阵X的任何条件限制,并且跨越整个优化路径(不仅仅在收敛处)