Feb, 2018

VR-SGD: 一种简单的随机方差缩减机器学习方法

TL;DR本文提出了一种名为VR-SGD的变体随机梯度下降法,其使用平均值和上一个时期的最后迭代作为两个向量,能够直接解决非光滑和/或非强凸问题,并能够使用更大的学习率。此方法在解决各种机器学习问题,如凸和非凸的经验风险最小化以及特征值计算等方面,具有更快的收敛速度。