Aug, 2022

标准化激活函数:迈向更好收敛

TL;DR本论文研究了激活函数对神经网络梯度方差的影响,并提出了一种对激活函数进行归一化的方法,以保持所有层的梯度方差相同,从而提高神经网络的收敛性。研究发现,归一化激活函数可显著提高模型性能。