Jul, 2023

曲率损失函数视角下的记忆化

TL;DR本文提出通过损失函数对训练样本曲率的测量来对神经网络的记忆化能力进行研究和分析。通过对 popular image datasets 的样本进行测量、可视化和排序,研究展示了神经网络在长尾数据、错误标签和冲突样本方面的记忆化失效,并发现了 CIFAR100 数据集中存在的重复标签问题。实验结果表明,通过曲率排序可以有效地找到疑似错误标签的样本。