开放世界中的大规模长尾识别
本研究介绍了ImageNet Large Scale Visual Recognition Challenge数据集的创建及在对象识别方面的进展,强调了收集大规模地面真实注释的挑战,分析了大规模图像分类和目标检测领域的现状,并将最先进的计算机视觉准确性与人类准确性进行了比较。最后总结了挑战五年来的经验教训,并提出了未来方向和改进措施。
Sep, 2014
通过对线性变换特征空间距离单调递减函数的和进行分组来解决“开放空间风险”和经验风险之间的平衡,提出了开放世界识别问题,提出了一种用于评估开放世界识别系统的协议,并演示Nearest Non-Outlier算法如何可靠有效地处理大规模的图像数据集。
Dec, 2014
这篇论文研究了长尾分布对计算机视觉和视觉识别的影响,通过对大规模细粒度分类数据集和深度学习分类算法的分析,发现训练样本数量对分类性能的影响非常大,迁移学习在当前方法中表现欠佳,因此研究人员建议应对长尾分布的问题进行全面思考。
Sep, 2017
本研究中,我们解耦学习过程,系统地探索不同平衡策略如何影响长尾识别的表示学习和分类器。我们的发现表明,数据不平衡在学习高质量表示方面可能不是问题,在使用最简单的实例平衡抽样进行学习表示的情况下,只需调整分类器就能实现强大的长尾识别能力,甚至可以胜过精心设计的损失、采样策略以及使用记忆组件的复杂模块。
Oct, 2019
提出了一种新的框架 CBD,利用知识蒸馏增强特征表示,通过使用类平衡采样,第二阶段的训练使得特征表示能够在少数类上进化,可以自然的适用多个 Teachers,并在 ImageNet-LT,iNaturalist17 和 iNaturalist18 数据集上取得比现有技术更好的性能。
Apr, 2021
本文提出了一种基于ACE(Ally Complementary Experts)的单阶长尾识别方法,在不需要专门的分类器预训练的情况下,在CIFAR10-LT,CIFAR100-LT,ImageNet-LT和iNaturalist数据集上实现了显着的性能提升,打破了“见锯齿现象”的平衡,并同时提高了多数和少数类别的准确性。
Aug, 2021
本文系统总结了深度长尾学习的最新进展,围绕着类别再平衡、信息增强和模块改进三个主要类别对相关方法进行详细探讨,并通过提出的相对准确度评估指标对最先进的方法进行了实证分析,为深度长尾学习的应用和未来研究方向提供了重要的参考。
Oct, 2021
通过Open Long-Tailed Recognition++算法,实现在自然分布数据上的imbalanced classification、few-shot learning、open-set recognition和active learning,并且能够在头尾识别之间共享视觉知识、降低尾部与开放类别的混淆,同时提供了基于视觉记忆的主动学习方案。
Aug, 2022
该论文提出了一种名为GLMC的训练策略,旨在解决长尾视觉识别中的特征提取器鲁棒性和分类器偏差问题,其中核心思想包括全局和局部混合一致性损失、累积头尾软标签权重损失等,该方法在多个数据集上达到了最新的准确度,并证明了其对提高邻近算法泛化的有效性。
May, 2023