BriefGPT.xyz
Ask
alpha
关键词
normalized activation functions
搜索结果 - 1
标准化激活函数:迈向更好收敛
本论文研究了激活函数对神经网络梯度方差的影响,并提出了一种对激活函数进行归一化的方法,以保持所有层的梯度方差相同,从而提高神经网络的收敛性。研究发现,归一化激活函数可显著提高模型性能。
PDF
2 years ago
Prev
Next