BriefGPT.xyz
Ask
alpha
关键词
variance of gradients
搜索结果 - 2
标准化激活函数:迈向更好收敛
本论文研究了激活函数对神经网络梯度方差的影响,并提出了一种对激活函数进行归一化的方法,以保持所有层的梯度方差相同,从而提高神经网络的收敛性。研究发现,归一化激活函数可显著提高模型性能。
PDF
2 years ago
CVPR
利用梯度方差估计示例难度
该论文提出了一种名为 VoG 的评估指标,可以通过评估模型求解困难样本,从而实现模型的可解释性和泛化性能,并在数据样本的噪声和记忆样本方面得到应用。
PDF
4 years ago
Prev
Next