Oct, 2019

纯与伪的临界点:线性网络的几何研究

TL;DR本文研究神经网络的损失函数,通过对其函数空间和权重参数化的几何性质进行自然区分,提出了纯关键点和虚假关键点的概念,并应用于线性神经网络的损失函数。通过利用行列式变量的几何属性,得到了不同损失函数和不同参数化的线性网络的新结果。发现如果网络能够表达所有的线性映射,则其损失函数的地形中不存在坏的局部极小值点;否则,只有当网络的功能空间是行列式变量集时,此时二次损失才不存在坏的局部极小值点。