ICLRJan, 2020

通过参数的 GSNR 解析神经网络良好泛化的原因

TL;DR本文利用深度神经网络的斜率噪声比率(GSNR)提出了新的模型参数研究视角,建立了模型参数的 GSNR 和泛化差距之间的定量关系,并展示了相对于浅层模型,DNNs 的梯度下降优化动态自然产生大 GSNR,这可能是 DNNs 出色的泛化能力的关键。