BriefGPT.xyz
Ask
alpha
关键词
gradient signal to noise ratio
搜索结果 - 1
ICLR
通过参数的 GSNR 解析神经网络良好泛化的原因
本文利用深度神经网络的斜率噪声比率(GSNR)提出了新的模型参数研究视角,建立了模型参数的 GSNR 和泛化差距之间的定量关系,并展示了相对于浅层模型,DNNs 的梯度下降优化动态自然产生大 GSNR,这可能是 DNNs 出色的泛化能力的关
→
PDF
4 years ago
Prev
Next