Jun, 2018

线性卷积网络中梯度下降的隐性偏差

TL;DR本研究通过使用梯度下降法在全宽线性卷积网络上的实验,证明它在深度为 L 时收敛于一个与频域中的 L2/L bridge penalty 相关的线性预测器。与此相反,对于线性全连接网络,无论深度如何,梯度下降法都收敛于硬边界的线性支持向量机解。