Jul, 2019

深层 ResNets 是否能被证明比线性预测器更好?

TL;DR本研究利用几何条件证明了多跳连接可以改善优化过程中的局部极小值问题,并证明了在 ResNet 的优化空间中的任何关键点要么优于最佳线性预测器,要么其 Hessian 矩阵有严格负的特征值。同时,我们还证明了深度残差网络的 “接近恒等区域” 的深度无关上界。