Jun, 2024

在没有梯度噪声的权重矩阵谱中制造重尾

TL;DR通过分析深度神经网络的重尾谱、梯度噪声和学习率等因素,我们揭示了深度神经网络在有限的训练步骤后可以生成重尾谱的机制,并研究了重尾谱与泛化能力之间的相关性。