Feb, 2019

均匀收敛可能无法解释深度学习中的泛化

TL;DR通过实验结果,揭示了现存深度学习的多种基于均匀收敛理论的泛化界都是数值较大,因而引起了人们的质疑。而对于使用 GD 训练的超参数线性分类器和神经网络,即使我们考虑 GD 的隐式偏差,两边的均匀收敛都无法解释泛化,使得基于均匀收敛的泛化界失去了其解释能力。