Dec, 2018

深度学习中方差缩减优化算法的无效性

TL;DR本文探讨了随机方差缩小技术在优化中的应用,研究发现在训练现代深度神经网络中,由于遇到难解的非凸优化问题,直接应用 SVRG 技术等方法效果不佳。