Jun, 2019
关于噪声梯度下降泛化为随机梯度下降的研究
The Multiplicative Noise in Stochastic Gradient Descent: Data-Dependent
Regularization, Continuous and Discrete Approximation
TL;DR本研究探讨了梯度噪声在深度学习中的正则化作用,发现除了随机梯度下降噪声外,其他类型的噪声也能有效地进行梯度下降的正则化。同时该研究提出了一种噪声下降的算法,能够拓展噪声的选择,有利于大批量SGD训练,同时也不会影响泛化性能。