ICLRJun, 2021

均方误差下的神经崩溃:靠近中心路径的动态

TL;DR研究表明,最近发现的神经崩溃现象在均方误差和交叉熵损失训练的深度神经网络中普遍存在,由最后一层特征的崩溃导致,本文提出了一个新的理论构建,即中心路径,沿着此路径进行归一化梯度流动力学的研究得出了精确的动态预测神经崩溃现象。