Dec, 2023

关于雅可比正则化训练神经网络的无限宽度分析

TL;DR该研究采用无穷宽度分析,证明了深度神经网络及其雅可比矩阵初始条件下,当隐藏层宽度趋近无穷时,它们共同收敛于高斯过程,并通过一种线性一阶常微分方程描述了在所谓鲁棒训练下的多层感知机演化,该方程由一种神经切向核的变体决定。实验证明了理论断言与宽有限网络的相关性,并通过核回归解析研究雅可比矩阵正则化的性质。