置信度评分使得基于实例的标签噪音学习成为可能
本文针对实例相关标签噪声的学习难题,基于人类认知的分解思想,采用基于部分的标签噪声来近似实例相关标签噪声,通过基于先验的锚点学习过程,结合各部分转移矩阵进行概率近似,得到超越现有方法的实验结果。
Jun, 2020
本文提出 CORES^2(COnfidence REgularized Sample Sieve)滤除具有实例依赖标签噪声的数据集中的错误标签样本,实现不需要确定噪声比率,可显著提高DNN模型的性能和训练效率。
Oct, 2020
该论文提出了一种理论测试,证明现实世界的数据集中的噪声不太可能是类条件噪声,而是实例依赖噪声。研究者们还提出了一种可控的实例依赖噪声生成算法和一种小型算法SEAL来应对这种噪声,并在各种噪声分数下表现出色,同时提高了在真实世界噪音基准Clothing1M上的泛化能力。
Dec, 2020
该研究提出一种二阶方法来处理深度神经网络训练中的标签噪音问题,使用此方法可以解决由任务难度引起的实例相关的噪音,提供一个新的损失函数来处理实例相关噪音,进而能够使用已有的类相关噪音的解决方案来处理该问题。
Dec, 2020
本文旨在提供对过拟合模型的影响的理解,例如深度神经网络如何记忆与实例相关的嘈杂标签,并分析现有方法处理这一问题的优缺点及对不同频率实例的影响。通过我们的分析,发现现有方法对不同频率实例的处理不同。因此,这项观察结果需要我们重新思考标签噪声分布以及对不同频率实例的不同处理。
Feb, 2021
本文提出了一个基于特征依赖的标签噪声处理算法,该算法采用渐进式标签校正策略,通过理论证明其可以适应广泛的噪声模式并收敛于贝叶斯分类器,实验证明其优于SOTA基线算法且对各种噪声类型和程度具有鲁棒性。
Mar, 2021
本文介绍了基于结构因果模型的深度生成模型算法,解决了大规模数据集中存在的标签噪声问题。该算法有效利用了噪声标签的监督信息,并在合成和实际的噪声标签数据集上表现优异。
May, 2023
提出一种能够有效提高 SOTA noisy-label learning 方法性能的新噪声标签学习图模型,该模型能够准确估计噪声率并用于训练过程的样本选择阶段。
May, 2023
本文通过理论分析探讨了在样本噪声存在的情况下,仅使用噪声样本能否学习到可靠模型的问题。作者认为,没有额外假设条件的情况下,经验风险最小化可以达到最优风险上限。此外,文章还讨论了0-1损失的极小极大下限问题,认为纯使用噪声样本无法学习。
Jun, 2023
使用易样本辅助选择难样本进行标签纠正从而实现去噪标签学习,并且在Instance-Dependent噪声数据集上展示出比其他最先进方法更出色的性能。
Jul, 2024