CVPRMar, 2022

神经网络是否可以学习相同模型两次?从决策边界角度探讨可复现性和双重下降现象

TL;DR探讨了神经网络决策边界和决策区域可视化的方法,并使用这些可视化方法研究神经网络训练中的可重复性和泛化问题。观察到模型体系结构(及其相关归纳偏差)的改变导致决策边界可见的变化,但同一体系结构下的多次运行产生的结果非常相似,特别是在宽体系结构的情况下。此外,利用决策边界方法可以可视化双重下降现象,并发现决策边界的可重复性强烈依赖于模型宽度。越接近插值阈值,神经网络的决策边界就会分解成许多小的决策区域,并且这些区域是不可重复的。同时,非常狭窄和非常宽的网络在其决策边界上具有较高的可重复性,并且只有相对较少的决策区域。讨论了观察结果与凸模型双重下降现象理论的关系。