Dec, 2023

线性模块连接的分离

TL;DR神经网络损失地形的线性模式连接 (或缺乏连接) 是一个有趣的特性,尽管在经验上已经被证实,但还缺乏适当的理论理解。本文通过探讨三个因素(架构、训练策略和底层数据集)对线性模式连接的影响,旨在弥补文献中对当网络展示线性模式连接的系统性研究的不足。我们特别关注最少但非平凡的设置,以尽可能消除不必要的复杂性,并相信我们的观察能够指导未来揭示线性模式连接内部机制的理论研究。