Jul, 2023

AI 中的隐式正则化遇到优化中的广义逼近难度 —— 关于对角线性网络的尖锐结果

TL;DR该研究探讨深度学习和人工智能中神经网络结构和梯度优化方法所施加的隐式规则化作用,并通过研究 Diagonal Linear Networks (DLNs) 的梯度流在过参数化回归设置下的隐式规则化,解释了泛化难度的相变现象与基础追踪优化问题收敛的关系,并且提出了新的收敛界限及其初值大小与选取最小化者的联系。