BriefGPT.xyz
Ask
alpha
关键词
ntk parametrization
搜索结果 - 1
ICML
Tensor Programs IIb: 神经切向核训练动态的架构通用性
通过 Tensor Programs 技术在 Tensor Program 中分析的 SGD 动态,我们证明了使用 NTK 参数化的相同神经网络在训练期间遵循功能空间中的内核梯度下降动态,其中内核是无穷宽度 NTK,从而完整证明了 NTK
→
PDF
3 years ago
Prev
Next