ICMLMay, 2018

深度卷积神经网络的泛化和优化性能理解

TL;DR本文理论分析卷积神经网络(CNN)的泛化性能、梯度下降训练算法的优化保证,证明了 CNN 的泛化误差由自由度和体系结构参数决定,并证明了梯度下降算法的近似稳定点是人口风险的近似稳定点,保证了 CNN 的良好泛化性能。