应对标签噪声的重新分组中值损失
该论文提出两种简单且有效的基于强大损失设计的方法,通过减少假负例的影响及使用基于缺失标签的最大似然标准来改进多标签学习的性能,从而在大量多标签图像分类数据集上实现了新的最先进的损失函数。
Dec, 2021
本文提出了一种新的方法,使用截断的 M 估计器来自适应地选择小损失的样本,并减少噪声标签对其的影响,同时利用丢弃的大损失的样本来帮助泛化,理论上证明了该方法具有容忍标签噪声的特性,经验上,全面的实验结果表明该方法在多种基准模型上表现出色,并且对各种噪声类型和水平具有鲁棒性。
Sep, 2023
本文通过模型和数据维度尝试处理嘈杂标签学习中的误差积累问题。引入均值点集成方法来利用更鲁棒的损失函数和未被选择样本中的更多信息从模型角度减少误差积累;从数据角度,选择翻转图像的损失值来代替原始图像的损失值选择小损失样本,以减少误差积累。在 CIFAR-10、CIFAR-100 和大规模 Clothing1M 上的广泛实验表明,我们的方法优于不同噪声水平的最先进的嘈杂标签学习方法,也可以与其他噪声标签学习方法无缝结合以进一步提高它们的性能并很好地推广给其他任务。
Dec, 2022
本研究提出了一种无标签学习的新方法,将区间估计引入了样本选择过程,以更好地探索未被充分选择的正确标注但看似贴错标签的较大损失数据和代表性差的数据,提高了误标噪声下的学习鲁棒性。
Jun, 2021
本文介绍一种新的噪声鲁棒学习方法,将噪声率估计整合到样本选择方法中,以处理有噪声的数据集,首先根据损失值的分布使用线性回归估计数据集的噪声率,然后根据估计的噪声率排除可能有噪声的样本,并进一步使用稀疏正则化来提高我们的深度学习模型的鲁棒性,实验证明我们的方法在处理具有较大噪声率的数据集时优于其他现有的噪声鲁棒学习方法。
Dec, 2023
通过自我监督学习建模样本之间的关系,并采用知识蒸馏的方法增强对潜在关联的理解,从而缓解模糊标签的影响,该研究提出了一个处理噪声标签的关系建模和蒸馏框架,该框架能够学习具有噪声的数据的判别性表示,并取得比现有方法更优越的性能。
May, 2024
本文提出了一种使用 beta 混合模型作为无监督生成模型,实时估计样本被错误标记的概率的方法,并通过 bootstrapping loss 来校正模型。同时,作者还对 mixup 数据增强方法做了进一步优化,实验证明该方法具有比最近最先进的方法更强的标签噪声鲁棒性。
Apr, 2019
提出了一种名为 DivideMix 的新型深度学习框架,通过利用半监督学习技术来将训练数据动态分成一个包含清晰样本的标记集合和一个包含噪声样本的未标记集合,并在半监督的方式下同时对标记与未标记数据进行训练,使用 MixMatch 策略在标记和未标记样本上分别执行标记共修整和标记共猜测以进行标签协同改进。在多个基准数据集上的实验显示出 DivideMix 比现有最先进的方法具有显着的改进。
Feb, 2020
本文提出了一种新颖的嘈杂标记学习框架 ProMix,通过高置信度匹配选择技术,最大限度地提高干净样本的效用,实验结果表明,该方法在 CIFAR-10N 和 CIFAR-100N 数据集上都能够取得比最佳基线方法更好的表现。
Jul, 2022