Feb, 2018

随机梯度下降漫步

TL;DR我们研究了随机梯度下降在超参数化深度神经网络的损失面上如何导航,发现学习率和批量大小在深度神经网络优化和泛化中具有不同的作用,并且 ' 在高度上在墙之间弹跳 ' 机制对于泛化至关重要。