Oct, 2023

ReLU 网络中 XOR 聚类数据的良性过拟合与理解

TL;DR在本研究中,我们证明在两层 ReLU 网络中,通过梯度下降训练,当训练标签中有恒定比例的错误时,神经网络在第一步达到 100%的训练准确性,然后在测试数据上表现出随机的准确性,而在后续的训练步骤中达到接近最优的测试准确性,这展示了一种新的过拟合现象。