标签噪声下的鲁棒长尾学习

Aug, 2021

Robust Long-Tailed Learning under Label Noise

Tong Wei, Jiang-Xin Shi, Wei-Wei Tu, Yu-Feng Li

TL;DR研究了在长尾标签分布下标签噪声问题，提出了一种新的原型噪声检测方法及一个鲁棒的框架，该框架通过软伪标签技术和半监督学习算法进一步提高了泛化性能，并且在基准和真实数据集上表现优于现有基线模型，尤其是比 DivideMix 模型测试精度高出 3％。

Abstract

long-tailed learning has attracted much attention recently, with the goal of improving generalisation for tail classes. Most existing works use supervised learning without considering the prevailing noise in the training dataset. To move →

long-tailed learning label noise deep neural networks semi-supervised learning soft pseudo-labeling

发现论文，激发创造

学习长尾数据的降标签方法

减少长尾数据标注成本的弱监督学习方法，有效保留了尾部样本的有监督信息，并提出了一种简单高效且具有强大理论保证的学习框架，通过对 ImageNet 等基准数据集的广泛实验证实了其有效性，优于最先进的弱监督方法。

Mar, 2024

长尾有噪标注实例分割基准测试（简版）

本文考虑了在包含标签噪声的长尾数据集上的实例分割任务，并提出了一个新的数据集，该数据集是一个包含标签噪声的大型词汇长尾数据集，结果表明训练集中的噪声将阻碍模型学习稀有类别，并降低整体性能，从而激发我们探索有效解决这个实际挑战的方法。

Nov, 2022

协同学习与拼合相结合的多标签视觉识别技术

本文重点研究在含有噪声标签的长尾多标签视觉数据中如何降噪，提出了一种 Stitch-Up 数据增强方法和一个 Heterogeneous Co-Learning 框架，实现去噪和更健壮的表征学习。通过两个挑战性基准测试，VOC-MLT-Noise 和 COCO-MLT-Noise，证明了该方法的有效性。

Jul, 2023

提取清洁平衡的子集以用于嘈杂的长尾分类

使用基于分布匹配的类原型和最优传输的伪标注方法，结合观察标签和伪标签的有效筛选标准，成功解决了长尾分布和标签噪声的联合问题，提供了更加平衡、准确的训练样本集，为具有标签噪声的长尾分类提供了有效的性能提升。

Apr, 2024

解决长尾噪声标签学习问题：基于标签珍稀性考虑的两阶段解决方案

通过结合软标签修复与多专家集成学习的有效的两阶段方法，我们介绍了一种克服先前方法限制的方法，用于处理真实世界数据集中存在的噪声标签和类别不平衡问题，实验证实了我们的方法的优越性。

Mar, 2024

识别长尾样本分布中的困难噪声

介绍了一个新的挑战，即噪声长尾分类（NLT），并设计了一种迭代噪声学习框架 Hard-to-Easy（H2E），通过将 “hard” 噪声降低到 “easy” 噪声来减轻了数据失衡的影响，并在长尾设置中超过了现有的去噪方法。

Jul, 2022

深度长尾学习综述

本文系统总结了深度长尾学习的最新进展，围绕着类别再平衡、信息增强和模块改进三个主要类别对相关方法进行详细探讨，并通过提出的相对准确度评估指标对最先进的方法进行了实证分析，为深度长尾学习的应用和未来研究方向提供了重要的参考。

Oct, 2021

APAM：自适应预训练和自适应元学习的语言模型，用于噪声标签和长尾学习

本文提出了一种基于对比学习的通用框架，通过特定的学习方法，包括 re-weighting 模块和多项式交叉熵损失和 focal loss 的结合，有效解决了自然语言处理中长尾问题和噪声标签的负面影响。

Feb, 2023

长尾分布下的对抗鲁棒性

本文探讨了长尾分布下的对抗鲁棒性问题，并提出了一个名为 RoBal 的有效算法框架，该框架包括两个模块：一个尺度不变分类器和数据再平衡。

Apr, 2021

通过平滑尾部数据逐步学习，提高长尾目标检测能力

本文通过构建 smooth-tail 数据实现对长尾数据的更精确检测，并通过逐步优化模型以达到提高模型性能的目的。通过在 LVIS v0.5 和 LVIS v1.0 数据集上进行实验验证了本方法的卓越性能。

May, 2023