Jun, 2023

使用铰链损失函数训练浅层 ReLU 网络的噪声数据:过拟合何时发生且是否良性?

TL;DR本文探讨了使用梯度下降和 hinge loss 在嘈杂数据上训练的两层 ReLU 网络的良性过拟合问题,研究了线性可分数据,给出了干净数据边距的条件,得到了良性过拟合,过拟合和非过拟合三种不同的情况,并揭示了神经元训练过程中的两个不同阶段。