Jan, 2021

BN不变量锐化正则化训练模型以获得更好的泛化能力

TL;DR本文提出了一种与BN层等价的神经网络下具有一致性的、刻画了梯度的度量标准和对应的优化算法,该算法利用该标准对训练进行正则化,获得了与原始SGD相比较显著的性能提升。