AAAIMar, 2021

深入探究方差传递和归一化:平均梯度的偏移导致网络崩溃

TL;DR通过研究彼此之间的关系,本文旨在对批归一化 (BN) 的实际效果进行解释,并通过提出参数权重标准化 (PWS) 解决平均梯度偏移的问题,从而使神经网络更快地收敛并在方差传递的角度解释 BN 的作用。