ICLRMay, 2018

深度学习具有泛化能力是因为参数 - 函数映射倾向于简单函数

TL;DR本文提供了深度神经网络的隐式正则化和广义性能的新解释,即表明深度神经网络的参数 - 函数映射应该具有指数偏向简单函数的现象,并且该内在的简单性依赖有助于解释为什么深度网络在现实世界的问题上具有良好的泛化性能。此外,本文提出了一种基于 PAC-Bayes 理论的方法,可以保证目标函数产生高似然训练集时的良好期望泛化,而且该方法的普适性更好。