Jun, 2020

两层神经网络模型中梯度下降动态的熄灭 - 激活行为

TL;DR探讨了梯度下降算法在训练两层神经网络模型时的现象学和数值研究,提出了显式正则化机制,并发现了网络的动态行为.