May, 2019
一种支配所有的方法:用于数据、参数和多种新方法的方差缩减
One Method to Rule Them All: Variance Reduction for Data, Parameters and
Many New Methods
TL;DR提出了一种通用的降方差的方法,适用于解决带有大量训练样例或大型模型维度或两者都有的正则化经验风险最小化问题。该方法可以减少已知的多种方法,同时提供了一种单一的定理,该定理可以证明在平滑和拟强凸性假设下的线性收敛性。此外,该方法还为随机梯度和随机坐标下降等方法提供了首个统一的方法和理论。