Sep, 2018
利用堵塞转换理解深度神经网络的损失景观
The jamming transition as a paradigm to understand the loss landscape of deep neural networks
Mario Geiger, Stefano Spigler, Stéphane d'Ascoli, Levent Sagun, Marco Baity-Jesi...
TL;DR研究表明,神经网络在过参数化区域存在相变点,且能够拟合随机数据的能力与深度无关,该相变点附近的损失函数具有层次结构且学习动态容易出现雪崩样的变化,可能导致学习的数据模式产生突变。