Dec, 2023

使用 James-Stein 估计器改善归一化

TL;DR在本文中,我们首先确定深度学习中的归一化层使用的均值和方差估计器不可接受,然后介绍了一种运用 James-Stein 估计器改进均值和方差估计的新方法,评估表明我们改进的归一化层在各种计算机视觉任务中始终具有优越的准确性,而且不增加额外的计算负担。此外,我们还研究了两种显著的缩小估计器:Ridge 和 LASSO,通过可视化表示直观地展示了缩小对估计层统计量的影响,并对正则化和批量大小对我们修改后的批量归一化的影响进行了研究,研究显示我们的方法对批量大小和正则化不太敏感,在不同设置下提高了准确性。