ICMLMay, 2021

Tensor Programs IIb: 神经切向核训练动态的架构通用性

TL;DR通过 Tensor Programs 技术在 Tensor Program 中分析的 SGD 动态,我们证明了使用 NTK 参数化的相同神经网络在训练期间遵循功能空间中的内核梯度下降动态,其中内核是无穷宽度 NTK,从而完整证明了 NTK 行为的结构普适性。