Dec, 2019

分类数据集中的错误标记实例识别

TL;DR本文提出了一种非参数化端到端的流程,用于发现在数字、图像和自然语言数据集中的错误标签实例。作者评估了其系统在添加少量标签噪音的情况下的性能,并显示了系统的 top 1%推荐的平均精度超过 0.84。作者最终将其方法的代码和可实现的实现发布出来。