ICMLJun, 2018

层旋转:深层网络泛化的一个惊人而强大的指标?

TL;DR通过实验证明, 学习过程中各层权重矢量与初始值之间余弦距离的演化,是分类器效果预测的一个可靠指标, 余弦距离与准确性成正比,控制每层权重余弦距离能提高事先不知道的分类准确性并同时解释学习率调整、权重衰减和梯度优化等方法对泛化性和训练速度的影响。