Aug, 2018
通过结构化数据上的随机梯度下降学习超参数神经网络
Learning Overparameterized Neural Networks via Stochastic Gradient Descent on Structured Data
Yuanzhi Li, Yingyu Liang
TL;DR本文研究了使用随机梯度下降法从随机初始化开始学习两层超参数化 ReLU 神经网络以进行多类分类问题,证明了当数据来自于分离度高的混合分布时,SGD 学习到的网络具有较小的泛化误差,分析了学习神经网络的几个方面并在合成数据和 MNIST 数据集上进行了实证验证。