BriefGPT.xyz
Ask
alpha
关键词
heavy-tailed spectra
搜索结果 - 1
在没有梯度噪声的权重矩阵谱中制造重尾
通过分析深度神经网络的重尾谱、梯度噪声和学习率等因素,我们揭示了深度神经网络在有限的训练步骤后可以生成重尾谱的机制,并研究了重尾谱与泛化能力之间的相关性。
PDF
a month ago
Prev
Next