Jun, 2021

隐式偏差对于对角线线性网络SGD的影响:随机性的证明性效益

TL;DR本文研究了随机梯度下降在对角线线性网络上的动态规律,证明了它比梯度下降的解具有更好的泛化性能,并发现收敛速度控制偏见效应的大小,结果支持了结构化噪声可以引起更好泛化性能的理论结论。