BriefGPT.xyz
May, 2020
深度学习中的隐式正则化可能无法通过规范解释
Implicit Regularization in Deep Learning May Not Be Explainable by Norms
HTML
PDF
Noam Razin, Nadav Cohen
TL;DR
通过矩阵分解问题的数学建模,探究梯度优化算法所诱导的隐含正则化问题,研究发现规范(norms)不能完全解释矩阵分解问题中的正则化问题,通过实验证明排名(rank)是更有用的解释方式以及有可能解释深度学习中的泛化问题。
Abstract
Mathematically characterizing the
implicit regularization
induced by
gradient-based optimization
is a longstanding pursuit in the theory of
deep
→