利用对齐集解决实例相关的标签噪声问题

Jul, 2023

Leveraging an Alignment Set in Tackling Instance-Dependent Label Noise

Donna Tjandra, Jenna Wiens

TL;DR我们提出了一种针对存在实例相关标签噪声的两阶段方法，利用锚定点取得了判别性能的显著改进，同时减轻了偏差。

Abstract

noisy training labels can hurt model performance. Most approaches that aim to address label noise assume label noise is independent from t

发现论文，激发创造

本文针对实例相关标签噪声的学习难题，基于人类认知的分解思想，采用基于部分的标签噪声来近似实例相关标签噪声，通过基于先验的锚点学习过程，结合各部分转移矩阵进行概率近似，得到超越现有方法的实验结果。

Jun, 2020

本文介绍了基于结构因果模型的深度生成模型算法，解决了大规模数据集中存在的标签噪声问题。该算法有效利用了噪声标签的监督信息，并在合成和实际的噪声标签数据集上表现优异。

May, 2023

该研究提出一种二阶方法来处理深度神经网络训练中的标签噪音问题，使用此方法可以解决由任务难度引起的实例相关的噪音，提供一个新的损失函数来处理实例相关噪音，进而能够使用已有的类相关噪音的解决方案来处理该问题。

Dec, 2020

本文采用动态分布校准策略来解决与实例相关的标签噪声产生的严重分布偏移问题，提出基于多元高斯分布的平均值和协方差的两种方法来校准偏移后的分布，并在合成标签噪声和真实未知噪声数据集上进行了实验，验证了方法的实用性和有效性。

Oct, 2022

本文提出了一个基于特征依赖的标签噪声处理算法，该算法采用渐进式标签校正策略，通过理论证明其可以适应广泛的噪声模式并收敛于贝叶斯分类器，实验证明其优于 SOTA 基线算法且对各种噪声类型和程度具有鲁棒性。

Mar, 2021

通过 EchoAlign，将嘈杂的标签视为准确的，并修改相应的实例特征来更好地与嘈杂的标签保持一致，同时保留干净的原始实例以减轻训练和测试集之间的分布差异。

May, 2024

本文提出了一种利用结构因果模型的生成方法来应对标签噪声的问题，证明了合理地建模示例有助于识别标签噪声转移矩阵，从而带来更好的分类器，该方法在合成和真实世界的标签噪声数据集上均优于所有最先进的方法。

Sep, 2021

本文提出了一种基于可簇性条件的有效估计过程，使用邻域表示中的三阶共识即可准确估计唯一的转移矩阵，并证明了相比于使用锚点的方法，我们的方法使用的实例更多，具有更好的采样复杂度。

Feb, 2021

本文提出一种使用 “超集学习” 框架来处理标签噪声的方法，将目标信息进行模糊化，并添加额外的备选标签，以协同改善学习器的泛化性能。实验结果表明该方法在合成和真实数据上都能有效检测和纠正错误的训练标签。

May, 2023

本文提出一种基于数据驱动的主动标签清理方法来解决数据注释中的标签噪音问题，通过对样本进行优先级排序，提高数据集质量，具有较好的可行性和高效性。

Sep, 2021