BriefGPT.xyz
Ask
alpha
关键词
data scaling exponents
搜索结果 - 1
深度学习中 NTK 在理解泛化方面的局限性
本文通过缩放定律的角度研究神经切向核 (NTK) 及其经验性变量,发现它们无法完全解释神经网络泛化的重要方面。通过实际设置,我们展示了有限宽度神经网络相对于其对应的经验和无穷 NTK 起始时具有显着更好的数据缩放指数,并证明了 NTK 方法
→
PDF
2 years ago
Prev
Next