Jun, 2018
深度神经网络的更紧密的泛化界限:卷积神经网络、ResNet 等
On Tighter Generalization Bound for Deep Neural Networks: CNNs, ResNets, and Beyond
Xingguo Li, Junwei Lu, Zhaoran Wang, Jarvis Haupt, Tuo Zhao
TL;DR我们通过引入一种新的神经网络族的 Lipschitz 属性的表征,建立了一种基于边际的数据相关的广泛深度神经网络泛化误差界限,将其与深度、宽度以及网络的雅可比矩阵联系起来。和现有的结果相比,我们实现了明显更紧的泛化下界,并且还表明,对于损失有界的情况,可以进一步改善泛化下界。除了一般的前馈深度神经网络外,我们的结果可以应用于推导流行的体系结构,包括卷积神经网络和残差网络。在实现与上一项艺术相同的泛化误差的同时,我们的误差允许选择更大的权重矩阵参数空间,从而为神经网络提供更强的表达能力。其中还提供了数值评估来支持我们的理论。