Jan, 2020

利用边际排名下的面积识别错误标记的数据

TL;DR文章提出了一种新方法,使用区域下的边缘(AUM)统计量识别训练集中的错误标记数据,并通过添加一个带有特定错误标记样本的额外类来学习 AUM 上限以分离标记错误的数据。在 WebVision50 分类任务中,该方法去除了 17%的训练数据,产生了 1.6%(绝对)的测试误差改进,在 CIFAR100 上删除 13%的数据可导致 1.2%的误差下降。