Feb, 2024

浅层ReLU-like神经网络的损失景观:静态点、鞍点逃逸和网络嵌入

TL;DR我们研究了使用经验平方误差训练的一层隐藏层神经网络的损失景观。我们提出适用于非可微和可微情况的站点条件,并显示如果静止点不包含“逃逸神经元”,则它必须是局部最小值。此外,我们的研究还能够全面讨论网络嵌入如何重塑静止点。