Jun, 2023
使用铰链损失函数训练浅层ReLU网络的噪声数据:过拟合何时发生且是否良性?
Training shallow ReLU networks on noisy data using hinge loss: when do
we overfit and is it benign?
TL;DR本文探讨了使用梯度下降和hinge loss在嘈杂数据上训练的两层ReLU网络的良性过拟合问题,研究了线性可分数据,给出了干净数据边距的条件,得到了良性过拟合,过拟合和非过拟合三种不同的情况,并揭示了神经元训练过程中的两个不同阶段。