Oct, 2023

深度神经网络中的可交换宽度和深度缩放

TL;DR本论文研究深度神经网络的无限宽度和深度极限的可交换性行为,提出并定义了可交换性框架,并讨论了其对神经网络设计和扩展的影响。通过研究神经协方差核的可交换性,证明了在深度神经网络中,对于具有跳跃连接且分支适当缩放以避免爆炸行为的情况,当无限制地提高宽度和深度时,得到的协方差结构将趋于相同。这些发现有一些理论和实践上的意义。本论文采用了创新的证明技巧,并依赖于更易于理解的工具,使其对不熟悉随机微积分(用于WD(I)的证明)的读者更易理解。