Sep, 2018

利用堵塞转换理解深度神经网络的损失景观

TL;DR研究表明,神经网络在过参数化区域存在相变点,且能够拟合随机数据的能力与深度无关,该相变点附近的损失函数具有层次结构且学习动态容易出现雪崩样的变化,可能导致学习的数据模式产生突变。