Jun, 2023

早停止神经网络中清洁优先学习的出现

TL;DR当训练数据集中加入随机标签噪声时,神经网络在无噪声测试数据集上的预测错误率在早期训练时会先改善后恶化,表现出U形依赖于训练时间。我们的研究旨在探究这一现象背后的学习动态。我们理论上证明了,训练早期,梯度下降的更新方向由干净训练数据集确定,噪声样本集对其影响极小,导致了对干净数据的优先学习。此外,我们理论上和实验上表明,随着清洁优先学习的进行,干净样本的梯度优势逐渐减弱,最终导致清洁优先学习的终止和对噪声样本的拟合。