MMSep, 2018

一维深度线性神经网络梯度下降的指数收敛时间

TL;DR研究了基于梯度下降的深度线性神经网络训练中的收敛问题,发现在标准随机初始化下,迭代次数随着深度指数级增加,这可能是深度线性神经网络的梯度方法收敛难以理解的一个潜在障碍。