BriefGPT.xyz
May, 2017
深度学习中优化与隐式正则化的几何学
Geometry of Optimization and Implicit Regularization in Deep Learning
HTML
PDF
Behnam Neyshabur, Ryota Tomioka, Ruslan Salakhutdinov, Nathan Srebro
TL;DR
本文通过展示泛化能力不受网络大小控制,而受其他隐含控制方法控制的方式,阐述了优化在深度学习模型泛化中的至关重要性,并通过研究深度网络参数空间的几何和设计一种调整到此空间的最优化算法来改善泛化能力。
Abstract
We argue that the
optimization
plays a crucial role in
generalization
of
deep learning
models through
→