Oct, 2023

深度网络线性区域的训练动态

TL;DR在这项研究中,我们研究了连续分段仿射深度网络(如带有(渗漏的)ReLU 非线性的网络)训练动态的输入空间划分或线性区域,提出了一种包含了本地复杂性的新统计量,观察到在训练过程中,数据点周围的本地复杂性经历了几个阶段,与深度网络的记忆性和概括性能密切相关。