Mar, 2020
深度学习的大学习率阶段: 弹射机制
The large learning rate phase of deep learning: the catapult mechanism
TL;DR本文研究了学习速率对深度神经网络性能的影响,提出了一种具有可解训练动态的神经网络类,并在实际深度学习环境中验证了其预测,发现小学习率相当于传统理论下的无穷宽神经网络,而大学习率相当于梯度下降动态收敛到更平坦的极小值点,模型中预测的大而稳定的学习率范围得到了验证,同时发现在大学习率下模型性能优越。