Nov, 2023

深度学习中使用梯度下降法无法逼近极小值

TL;DR我们分析了深度学习网络中梯度下降算法的几何方面。具体而言,我们证明了对于欠参数的 ReLU 深度学习网络,Chen-Munoz Ewald 2023 论文中构建性地获得的全局最小成本所对应的权重和偏差通常无法通过梯度下降流逼近。因此,我们得出结论,Chen-Munoz Ewald 2023 论文中介绍的方法与梯度下降方法是不相同的。