基于零件的标签噪声: 迈向基于实例的标签噪声
本文提出 CORES^2(COnfidence REgularized Sample Sieve)滤除具有实例依赖标签噪声的数据集中的错误标签样本,实现不需要确定噪声比率,可显著提高DNN模型的性能和训练效率。
Oct, 2020
该论文提出了一种理论测试,证明现实世界的数据集中的噪声不太可能是类条件噪声,而是实例依赖噪声。研究者们还提出了一种可控的实例依赖噪声生成算法和一种小型算法SEAL来应对这种噪声,并在各种噪声分数下表现出色,同时提高了在真实世界噪音基准Clothing1M上的泛化能力。
Dec, 2020
该研究提出一种二阶方法来处理深度神经网络训练中的标签噪音问题,使用此方法可以解决由任务难度引起的实例相关的噪音,提供一个新的损失函数来处理实例相关噪音,进而能够使用已有的类相关噪音的解决方案来处理该问题。
Dec, 2020
本文旨在提供对过拟合模型的影响的理解,例如深度神经网络如何记忆与实例相关的嘈杂标签,并分析现有方法处理这一问题的优缺点及对不同频率实例的影响。通过我们的分析,发现现有方法对不同频率实例的处理不同。因此,这项观察结果需要我们重新思考标签噪声分布以及对不同频率实例的不同处理。
Feb, 2021
本文探讨了学习嘈杂标签所需的噪声转移矩阵的可辨识性,并通过 Kruskal 的可辨识性结果表明,对于一般情况下的实例级别的问题,识别噪声转移矩阵需要多个嘈杂标签的支持,此外,我们还展示了标签噪声转移的实例依赖性与统一的认识之间的联系,并提供了实证证据。
Feb, 2022
研究了标签噪声学习问题中的转移矩阵估计,基于人类任务标注时更加倾向于将外观相似的实例标注为同一类别的心理学和生理学证据,提出了T(x)几何形状的假设,并利用流形嵌入技术来有效地减少了其自由度并使其在实践中稳定可估计。实验结果表明,该方法在处理具有挑战性IDN数据时优于现有方法。
Jun, 2022
本文介绍了基于结构因果模型的深度生成模型算法,解决了大规模数据集中存在的标签噪声问题。该算法有效利用了噪声标签的监督信息,并在合成和实际的噪声标签数据集上表现优异。
May, 2023
在嘈杂标签学习中,为了开发一致的分类器,估计嘈杂的类别后验概率起着基础性的作用,因为它是估计干净的类别后验概率和过渡矩阵的基础。本文提出了一种增强监督信息与部分级标签相结合的方法,鼓励模型关注和整合来自各个部分的丰富信息以更精确地学习嘈杂的类别后验概率,最终改善分类性能。
May, 2024
使用易样本辅助选择难样本进行标签纠正从而实现去噪标签学习,并且在Instance-Dependent噪声数据集上展示出比其他最先进方法更出色的性能。
Jul, 2024