Oct, 2020
深度学习与核学习:损失函数梯度与神经切向核的时间演变的实证研究
Deep learning versus kernel learning: an empirical study of loss
landscape geometry and the time evolution of the Neural Tangent Kernel
Stanislav Fort, Gintare Karolina Dziugaite, Mansheej Paul, Sepideh Kharaghani, Daniel M. Roy...
TL;DR在深度神经网络训练中,训练动力学与损失面的几何形态和时空变化紧密关联,揭示了深度学习过程中快速的混沌瞬变和稳定状态之间的显著关系。