Jun, 2018

深度神经网络的更紧密的泛化界限:卷积神经网络、ResNet 等

TL;DR我们通过引入一种新的神经网络族的 Lipschitz 属性的表征,建立了一种基于边际的数据相关的广泛深度神经网络泛化误差界限,将其与深度、宽度以及网络的雅可比矩阵联系起来。和现有的结果相比,我们实现了明显更紧的泛化下界,并且还表明,对于损失有界的情况,可以进一步改善泛化下界。除了一般的前馈深度神经网络外,我们的结果可以应用于推导流行的体系结构,包括卷积神经网络和残差网络。在实现与上一项艺术相同的泛化误差的同时,我们的误差允许选择更大的权重矩阵参数空间,从而为神经网络提供更强的表达能力。其中还提供了数值评估来支持我们的理论。