May, 2019

在神经网络中围绕宽平坦最小值塑造学习模式

TL;DR本文研究了具有随机权重的一层和两层神经网络在非凸损失函数情况下的学习行为,引入了宽平原(WFM)这一概念,并探索了 WFM 如何出现以及在学习中起到什么作用。