Nov, 2018

深度学习的超参数化收敛理论

TL;DR通过对大规模深层神经网络的优化方法的研究,我们证明了 SGD 可以在多项式时间内发现 DNNs 训练目标上的全局极小值。