ICMLMay, 2023

Hessian 视角下的卷积神经网络本质

TL;DR本文通过 Hessian maps 的视角提出一种略微不同的卷积神经网络 (CNNs) 自然观点,从而揭示了 CNNs 的架构特征在其结构和性能中的表现;我们在 Toeplitz 表示的基础上,利用一种新的框架揭示了 Hessian 结构及其秩。我们证明了紧的上界,这些结果与 Hessian rank 的实际趋势紧密相似。总体而言,我们的工作推广了并且确立了一个关键性结论,即在卷积神经网络中,Hessian rank 随着参数数量的增加呈现出平方根增长趋势。