Apr, 2023

对角线性网络中的鞍点动态

TL;DR本文探讨了超参数初始化趋近于零时,激活集与损失函数极小值之间的关系,证明了激活集的约束下,梯度流跳跃到另一个鞍点的动态可作为增量学习的过程,并采用类似于Lasso路径计算的Homotopy算法解决了实现上的难点。