May, 2023

深度神经网络的智能梯度放大

TL;DR通过智能地确定哪些层需要进行梯度放大,我们提出了一个方法来优化深度学习模型在训练过程中的性能和减少训练时间,该方法分析了训练期间不同层的梯度波动,通过对简单和深度神经网络进行实验,我们证明了该方法可以提高模型的准确性,即使使用更高学习率训练模型。