May, 2023

单隐藏层神经网络梯度流性质与线性激活函数的研究

TL;DR通过研究神经网络的超参数化和过拟合对梯度下降算法鲁棒性的影响,我们证明了过度参数化会引入伪平衡点,阻碍梯度下降算法的收敛。