Apr, 2019

深度神经网络模型中带有跨连接的梯度下降算法分析

TL;DR研究了具有跳跃连接的深度神经网络模型的梯度下降算法的行为。证明了在超参数化区域内,通过适当的初始化,梯度下降可以以指数速度找到全局最小值。建立了沿着梯度下降路径的泛化误差评估,并得出在目标函数是由初始化定义的核定义的再生核希尔伯特空间(RKHS)时,沿着梯度下降路径存在可推广的提前停止解的结论。此外,还证明了 GD 路径与相关随机特征模型给出的函数之间的一致接近。因此,在这种 “隐式正则化” 环境中,深度神经网络模型退化为一个随机特征模型。结果适用于任何宽度大于输入维度的神经网络。