Oct, 2021

SGD达到零损失后会发生什么?——数学框架

TL;DR该论文提出了一个可以研究Stochastic Gradient Descent在overparametrized模型中的隐式偏差的通用框架,该框架使用一个描述参数极限动态的随机微分方程,并考虑了任意噪声协方差,文中给出了一些新结果,同时可以在线性模型中进行应用。