Dec, 2023

现实世界视觉数据集中自动误标签检测的实证研究

TL;DR计算机视觉中使用标记数据集是主要的进展,近期的研究工作提出了用于自动识别错误标记图像的方法,但在实际数据集中有效实施这些方法的策略仍未充分探索。本研究在多个数据集上对最近发展的自动化错误标记检测方法进行了详细评估,结果表明该方法在清理真实世界视觉数据集中性能相似甚至优于先前方法。通过精心设计方法,将该方法应用于真实世界计算机视觉数据集后,在较小的数据情况下使每个分类器的性能提高了 8%。