Jun, 2020

张量程序 II:任意结构神经切向核

TL;DR本文证明了任何结构的随机初始化神经网络在网络宽度趋于无穷大时,都会使其 Tangent Kerne(NTK)收敛于确定性极限,并介绍了如何计算此极限。文章还提到了梯度独立假设(GIA)的常见满足条件 ——Simple GIA Check,并探讨了 GIA 的适用范围和限制。最后,文中给出了基于无限宽度 NTK 的可重复实现的循环神经网络、Transformer 和批归一化等各类网络模型的代码。