May, 2019
正则化深层网络时时间很重要:权重衰减和数据增强影响早期学习动态,在收敛附近影响不大
Time Matters in Regularizing Deep Networks: Weight Decay and Data
Augmentation Affect Early Learning Dynamics, Matter Little Near Convergence
TL;DR研究表明,对于深度神经网络的正则化应在其初期而非后期进行,且应当重视学习过程中的瞬态行为而非渐进行为。