Jul, 2024

探索两层线性神经网络中基于时期的双重下降现象

TL;DR对两层线性神经网络中的epoch-wise双下降现象进行研究,通过推导出标准线性回归模型的学习动力学和具有二次权重的线性两层对角网络之间的梯度流,识别了额外的导致epoch-wise双下降的因素,进而引出了对真正深度模型的未知因素的进一步问题。