Oct, 2020

Batch Norm 是否独特?一个经验性研究与处方,在不依赖 Batch 的情况下模拟常见归一化器的最佳性能

TL;DR本论文通过对 “Batch Norm” 等常见标准化方法的统计特性进行广泛的实证研究,提出可以更好地匹配这些理想特性的两种新的标准化方法,PreLayerNorm 和 RegNorm 。研究表明,它们可以实现 Batch Norm 的大部分性能,而无需批次依赖关系,并且它们可在 Batch Norm 无效的情况下应用。