该论文针对长尾数据分类的问题,从特征层面提出了特征增强及对数调整方法,用以平衡嵌入(embedding)分布,消除分类器偏差,实验表明该方法超越了现有的最佳方法。
May, 2023
本文提出了一种适用于长尾数据的新的神经网络训练方法,使用高斯混合调整不同分类逻辑回归的差异,实现对样本在嵌入空间的调整,从而解决长尾问题,同时也提出了一种分类器的重新训练策略来减轻歧视,实验表明该方法具有卓越的性能。
本文提出了通过使用平衡的特征损失,通过课程学习来加强长尾类别的激励,强化尾部类别的特征规范,从而提高了长尾问题的性能,并在多个受欢迎的长尾识别基准上实现了优越的性能增益。
本文提出了一种新颖的基于推理的隐性语义数据增广方法来缓解长尾分布数据分类算法性能下降的问题,并通过构建协方差矩阵和知识图谱,从相似类别中采样新方向来生成新的样本实例,从而适应性增强长尾数据,实验证明该方法有效。
Dec, 2021
本文提出了一种新的解决长尾图像识别中头尾偏差问题的方法,通过调整标签空间来平衡数据,从而提高分类性能。实验证明该方法可应用于多种模型,并为长尾特征学习提供了思路。
Aug, 2022
研究论文提出了一种基于统一类别原型导向的视觉语言框架,用于有效缓解数据不平衡引起的特征空间偏差,并通过去除无关噪声文本和增强关键属性信息的模块提高模型的鲁棒性,同时通过类特征原型导向分类器解决学习分类器的正向偏差问题,从而在长尾学习中实现了比之前方法更优越的性能。
Aug, 2023
本研究中,我们解耦学习过程,系统地探索不同平衡策略如何影响长尾识别的表示学习和分类器。我们的发现表明,数据不平衡在学习高质量表示方面可能不是问题,在使用最简单的实例平衡抽样进行学习表示的情况下,只需调整分类器就能实现强大的长尾识别能力,甚至可以胜过精心设计的损失、采样策略以及使用记忆组件的复杂模块。
Oct, 2019
本文介绍了两种简单的技术对抗现实场景中数据标签分布的不平衡性,包括采用标签频率进行 logistic 校准 以及在训练过程中强制实施其中之一或两种技术能够鼓励罕见标签与支配标签之间拥有一个相对较大的罕见标签较大的标签在一些学习情况中具有更好的表现。
Jul, 2020
本文提出一种新的自适应损失(DropLoss),用于解决目标检测中长尾类别分布下的损失不平衡问题,以改善罕见类别的预测结果,提高模型在 LVIS 数据集上的表现。
Apr, 2021
本篇论文提出了一种输入输出平衡的框架来解决实际数据中的长尾分布问题,主要针对无人驾驶中的场景理解和 LiDAR 语义分割问题,该框架包含合成长尾实例和使用多头块组合不同类别两个模块,实验表明该方法有着良好的泛化能力。
Mar, 2021