BriefGPT.xyz
Ask
alpha
关键词
bn-sharpness
搜索结果 - 1
BN 不变量锐化正则化训练模型以获得更好的泛化能力
本文提出了一种与 BN 层等价的神经网络下具有一致性的、刻画了梯度的度量标准和对应的优化算法,该算法利用该标准对训练进行正则化,获得了与原始 SGD 相比较显著的性能提升。
PDF
3 years ago
Prev
Next