May, 2019

正则化深层网络时时间很重要:权重衰减和数据增强影响早期学习动态,在收敛附近影响不大

TL;DR研究表明,对于深度神经网络的正则化应在其初期而非后期进行,且应当重视学习过程中的瞬态行为而非渐进行为。