标签噪声类型及其对深度学习的影响

Mar, 2020

标签噪声类型及其对深度学习的影响

Label Noise Types and Their Effects on Deep Learning

Görkem Algan, İlkay Ulusoy

TL;DR本研究分析了不同类型的标签噪声对深度学习的影响，提出了一种基于特征相关性的标签噪声生成方法，并提供了常用基准数据集的标签噪声以便其他研究人员测试其算法。

Abstract

The recent success of deep learning is mostly due to the availability of big datasets with clean annotations. However, gathering a cleanly annotated dataset is not always feasible due to practical challenges. As a result, label noise is a common problem in datasets, and numerous method

发现论文，激发创造

深度学习对大规模标签噪声具有强韧性

本研究证明，基于深度神经网络的图像分类模型可以从含有数量远多于准确标签的训练数据中进行有效学习，表现出良好的测试性能提升，这种学习需要增加数据集大小作为代价。

May, 2017

医学影像分析中的噪声标签深度学习技术探究与研究

探讨了深度学习中标签噪声的影响，特别是在医疗应用中，给出了针对性的解决方案和建议，以提高深度模型在医疗图像分析中的准确程度。

Dec, 2019

深度学习下存在噪声标签的图像分类：综述

本文介紹關於使用深度學習算法處理帶有噪聲標籤的問題，針對噪聲建立噪聲模型和使用魯棒損失、正則化等方法建立魯棒算法兩種子群進行了綜述。

Dec, 2019

深度神经网络中的噪声标签学习：综述

本文综述了深度学习中标签噪声的学习问题，提供了62种最新的鲁棒训练方法，并系统性比较了六个评估指标。同时，分析了噪声估计率和评估方法，并提出了未来的几个研究方向。

Jul, 2020

依赖特征的标记噪声学习：一种渐进式方法

本文提出了一个基于特征依赖的标签噪声处理算法，该算法采用渐进式标签校正策略，通过理论证明其可以适应广泛的噪声模式并收敛于贝叶斯分类器，实验证明其优于SOTA基线算法且对各种噪声类型和程度具有鲁棒性。

Mar, 2021

有噪声标签的学习再探讨：使用真实世界人类注释的研究

本论文介绍了两个基准数据集CIFAR-10N和CIFAR-100N，使用这些数据集可以更好地理解真实世界嘈杂标签和合理地处理它们，量化和定性显示真实世界嘈杂标签表现出依赖于实例模式，与传统的基于类假设和合成标签的模式不同。并且，还通过与人工噪声和类依赖的合成噪声的对比研究，研究了记忆正确和错误预测的情况，从而表明真实世界的噪声模式比合成噪声模式更具挑战性，需要重新考虑带噪标签的学习问题。

Oct, 2021

重新思考标签价值：针对实例相关的标签噪声学习

本文介绍了基于结构因果模型的深度生成模型算法，解决了大规模数据集中存在的标签噪声问题。该算法有效利用了噪声标签的监督信息，并在合成和实际的噪声标签数据集上表现优异。

May, 2023

基于噪声率估计的样本选择噪声标签学习

提出一种能够有效提高 SOTA noisy-label learning 方法性能的新噪声标签学习图模型，该模型能够准确估计噪声率并用于训练过程的样本选择阶段。

May, 2023

生成真实标签：用于标签噪声研究的合成数据

提出了SYNLABEL框架，用于改进标签噪声研究，并允许创建一个无噪声的数据集，以用作干净的基准，并能注入和量化标签噪声。

Sep, 2023

分类中的噪音标签处理：一项调查

对于计算机视觉任务尤其是图像分类任务，本综述全面回顾了应对噪声标签的不同深度学习方法的演变，研究了不同的噪声模式，并提出了一种由现实世界数据引导的算法来生成合成标签噪声模式，以形成一个新的以真实世界数据为指导的合成基准，并在该基准上评估了一些典型的噪声鲁棒方法。

Apr, 2024