May, 2023

多层神经网络梯度下降的泛化保证

TL;DR对梯度下降训练的神经网络的稳定性和泛化性进行研究,探讨不同网络缩放参数的影响,发现在稳定性和超参数化方面的一些新的规律,并证明了过度参数化的神经网络可以达到所需的风险水平。