BriefGPT.xyz
Jun, 2021
隐式偏差对于对角线线性网络SGD的影响:随机性的证明性效益
Implicit Bias of SGD for Diagonal Linear Networks: a Provable Benefit of Stochasticity
HTML
PDF
Scott Pesme, Loucas Pillaud-Vivien, Nicolas Flammarion
TL;DR
本文研究了随机梯度下降在对角线线性网络上的动态规律,证明了它比梯度下降的解具有更好的泛化性能,并发现收敛速度控制偏见效应的大小,结果支持了结构化噪声可以引起更好泛化性能的理论结论。
Abstract
Understanding the
implicit bias
of
training algorithms
is of crucial importance in order to explain the success of overparametrised
neural networ
→