Jun, 2019

如何初始化网络?WeightNorm 和 ResNets 的鲁棒初始化

TL;DR本文研究权重规范化神经网络的参数初始化策略,通过使用平均场近似方法,提出了一种新的参数初始化策略。通过超过 2500 次实验,本文展示了所提出的初始化方法在图像数据集上具有更好的泛化性能、超参数值鲁棒性和种子之间的变异性。而且,该初始化方法与学习率预热相结合,能减小权重规范化神经网络与批量规范化神经网络之间性能的差距。