具有损失不确定性的样本选择及其在带噪声标签学习中的应用
本文介绍了一种寻找对标签噪声具有内在容忍性的损失函数的方法,并提供了一些在多类分类问题中让该损失函数在风险最小化时具有内在容忍标签噪声的充分条件,同时通过实验验证了基于平均误差值的损失函数是内在鲁棒的,并且标准反向传播足以学习出真正的分类器。
Dec, 2017
本文提出了一种使用beta混合模型作为无监督生成模型,实时估计样本被错误标记的概率的方法,并通过bootstrapping loss来校正模型。同时,作者还对mixup数据增强方法做了进一步优化,实验证明该方法具有比最近最先进的方法更强的标签噪声鲁棒性。
Apr, 2019
本文综述了深度学习中标签噪声的学习问题,提供了62种最新的鲁棒训练方法,并系统性比较了六个评估指标。同时,分析了噪声估计率和评估方法,并提出了未来的几个研究方向。
Jul, 2020
本文通过模型和数据维度尝试处理嘈杂标签学习中的误差积累问题。引入均值点集成方法来利用更鲁棒的损失函数和未被选择样本中的更多信息从模型角度减少误差积累;从数据角度,选择翻转图像的损失值来代替原始图像的损失值选择小损失样本,以减少误差积累。在CIFAR-10、CIFAR-100和大规模Clothing1M上的广泛实验表明,我们的方法优于不同噪声水平的最先进的嘈杂标签学习方法,也可以与其他噪声标签学习方法无缝结合以进一步提高它们的性能并很好地推广给其他任务。
Dec, 2022
提出一种能够有效提高 SOTA noisy-label learning 方法性能的新噪声标签学习图模型,该模型能够准确估计噪声率并用于训练过程的样本选择阶段。
May, 2023
本文提出了一种针对大型数据集中的标注错误而设计的噪声鲁棒性损失函数,并研究了该损失函数的应用及如何选择适当的损失函数,在 cifar-100 数据集上表现出色,此外还提出了一种新的 Bounded Cross Entropy 损失函数。
Jun, 2023
本文提出了一种新的方法,使用截断的M估计器来自适应地选择小损失的样本,并减少噪声标签对其的影响,同时利用丢弃的大损失的样本来帮助泛化,理论上证明了该方法具有容忍标签噪声的特性,经验上,全面的实验结果表明该方法在多种基准模型上表现出色,并且对各种噪声类型和水平具有鲁棒性。
Sep, 2023
RML是一种用于降低选择噪声样本概率和校正噪声样本损失的方法,通过稳定的均值损失和健壮的中值损失组合以获得噪声样本的鲁棒损失估计,并提出了新的样本选择策略和基于RML的半监督方法来进一步提高模型对标签噪声的性能。
Dec, 2023
在这篇论文中,我们揭示了现有的样本选择方法在实践中存在的数据和训练偏差问题,并提出了一种鲁棒的网络架构和混合采样策略来解决这些问题,以实现对带有噪声标签的学习任务的准确建模。
Jan, 2024
本研究解决了噪声标签学习领域中样本选择的有效性问题,提出了一种新的自适应最近邻和特征向量(ANNE)样本选择方法。该方法通过结合基于损失的采样和特征基于的采样策略,针对不同噪声率优化学习性能,实验证明ANNE在多种噪声场景下的准确性优于现有技术。
Nov, 2024