BriefGPT.xyz
Dec, 2017
神经网络的损失函数可视化
Visualizing the Loss Landscape of Neural Nets
HTML
PDF
Hao Li, Zheng Xu, Gavin Taylor, Tom Goldstein
TL;DR
本文通过可视化方法探讨神经网络损失函数的结构和损失景观对泛化的影响,提出了一种简单的“滤波器归一化”方法来可视化损失函数曲率并对损失函数进行有意义的比较。然后,利用各种可视化方法,探索网络结构如何影响损失景观,以及训练参数如何影响最小化器的形状。
Abstract
neural network training
relies on our ability to find "good" minimizers of highly non-convex
loss functions
. It is well known that certain
networ
→