Aug, 2020

ROOT-SGD:单算法的尖锐非渐近性和渐近效率

TL;DR本论文从统计的角度考虑了一阶随机优化问题,提出了一种基于过去随机梯度的递归平均方法 - 递归 One-Over-T SGD (ROOT-SGD),在在线方差约减随机逼近方法中达到了最先进的收敛速率,并且在稍强的分布式假设下,归一化最后的迭代会收敛于一个接近最优协方差的零均值高斯分布。