BriefGPT.xyz
Oct, 2021
不经过模型训练,检测数据标签是否已损坏
A Good Representation Detects Noisy Labels
HTML
PDF
Zhaowei Zhu, Zihao Dong, Hao Cheng, Yang Liu
TL;DR
提出了一种从更加数据中心的视角出发的培训自由的解决方法,以检测标签上的错误。通过邻域信息,提出了基于本地投票和基于排名的方法,从而在合成和实际噪声标签上进行实验证明了该方法的可行性和有效性。
Abstract
label noise
is pervasive in real-world datasets, which encodes wrong correlation patterns and impairs the generalization of
deep neural networks
(DNNs). It is critical to find efficient ways to detect the corrupt
→