本文针对训练数据集不均衡和 miscalibration 等问题,设计了两种方法,分别为标签感知平滑和批次偏移规范化,并在多个长尾识别基准数据集上创造了新记录。
Apr, 2021
本论文研究如何从长尾分布的样本中训练模型并校准,利用知识转移和重要性权重估算方法,将尾部类别的目标概率密度适应地从头部类别中传输,实现了长尾分布校准,并在多个数据集上证实了该方法的有效性。
Apr, 2023
本文提出了一种新的解决长尾图像识别中头尾偏差问题的方法,通过调整标签空间来平衡数据,从而提高分类性能。实验证明该方法可应用于多种模型,并为长尾特征学习提供了思路。
Aug, 2022
使用高度资源有效的二进制神经网络作为骨干结构来学习长尾分布,通过校准和蒸馏框架利用平衡数据集上的预训练全精度模型作为教师,结合对目标函数术语的对抗平衡和高效的多分辨率学习方案,在 15 个数据集上对最新的长尾数据集进行了最大规模的实证研究,结果显示我们的方法在平均上大幅优于现有技术(>14.33%)。
Mar, 2024
本文从领域自适应的角度分析了分类中长尾类别分布的问题,提出了基于元学习的显式估计类别条件分布差异的方案,并在六个基准数据集和三个损失函数上进行了验证。
Mar, 2020
本文提出了一种新方法,通过在特征空间中使用来自具有丰富样本的类别所学习的特征来增强特征空间中的欠表示类别,从而解决长尾分布问题。通过使用类别激活映射,将每个类别的特征分解为类别通用和类别特定部分,并将欠表示类别的类别特定特征与混淆类别的类别通用特征融合,实时生成新样本。结果表明,在 iNaturalist、ImageNet-LT、Places-LT 以及 CIFAR 的长尾版本等数据集上,本文所提出的方法展现了最先进的表现水平。
Aug, 2020
基于等角原型表示的自适应自标记策略,通过解决弛化的最优传输问题,更有效地发现不平衡的新类别,从而有效减轻已知和新类别学习中的偏差,并在 CIFAR100、ImageNet100、Herbarium19 和大规模 iNaturalist18 数据集上取得了卓越的结果。
Aug, 2023
本研究中,我们解耦学习过程,系统地探索不同平衡策略如何影响长尾识别的表示学习和分类器。我们的发现表明,数据不平衡在学习高质量表示方面可能不是问题,在使用最简单的实例平衡抽样进行学习表示的情况下,只需调整分类器就能实现强大的长尾识别能力,甚至可以胜过精心设计的损失、采样策略以及使用记忆组件的复杂模块。
Oct, 2019
该论文针对长尾数据分类的问题,从特征层面提出了特征增强及对数调整方法,用以平衡嵌入(embedding)分布,消除分类器偏差,实验表明该方法超越了现有的最佳方法。
May, 2023
利用特征分布的几何信息来引导模型学习尾类的潜在分布,并且通过特征不确定性建模以提高模型在测试领域中的泛化性能。
Jan, 2024