Apr, 2019

半循环随机梯度下降

TL;DR本文研究具有块循环结构的凸 SGD 更新,并提出了一种简单的方法,以便在保持性能保证的同时应用于预测。此结构可以显著恶化 SGD 算法的性能,但该方法可以保持 i.i.d.,非循环采样的同等性能保证。