Jan, 2021

BN 不变量锐化正则化训练模型以获得更好的泛化能力

TL;DR本文提出了一种与 BN 层等价的神经网络下具有一致性的、刻画了梯度的度量标准和对应的优化算法,该算法利用该标准对训练进行正则化,获得了与原始 SGD 相比较显著的性能提升。