Mar, 2024

从零到英雄:艺术简单初始条件下的局部曲率导致远离不良最小值

TL;DR我们研究了非凸和高维环境中梯度下降的优化动力学,重点研究了相位恢复问题作为复杂损失地形的案例研究。我们通过分析优化过程中局部曲率的变化,发现在下降的第一个阶段中,对于中等信噪比,Hessian 矩阵显示出朝向好的极小值的下降方向,然后被困在坏的极小值中。成功的相位恢复通过梯度下降在达到坏的极小值之前朝向好的极小值实现,这种机制解释了为什么在高维极限对应的算法过渡之前就能成功恢复。我们的分析揭示了这种新机制,在有限但非常大的维度下促进梯度下降动力学,同时强调了初始化谱特性对于在复杂高维地形中的优化的重要性。