本文对长尾视频识别进行了研究,提出了新的视频基准数据集和一种名为 Long-Tail Mixed Reconstruction 的方法,可显著减少过拟合并取得了最新的平均分类精度。
Apr, 2023
本文系统总结了深度长尾学习的最新进展,围绕着类别再平衡、信息增强和模块改进三个主要类别对相关方法进行详细探讨,并通过提出的相对准确度评估指标对最先进的方法进行了实证分析,为深度长尾学习的应用和未来研究方向提供了重要的参考。
Oct, 2021
本文探讨了 Video Long-Tailed Recognition 中难以应对的(1)任务不相关特征和(2)视频级标签的问题,并提出两种相互补充的可学习特征聚合器和基于类频率的近似扩展方法,使得算法达到了当今的最优效果。
Nov, 2022
使用三种新的核心功能块,以及集成在元学习框架中,解决长尾分布分类和领域漂移问题,提高了领域泛化在新的目标领域上的表现。
Jul, 2022
BALLAD 利用对比学习方法,结合视觉感知与语言理解,实现对于长尾数据集的视觉识别,并在大量实验中获得比竞争性基线更优异的表现。
Nov, 2021
本研究通过将长尾分布建模为不平衡领域,一般分布建模为平衡领域,提出了一种基于域适应的长尾识别解决机制。该机制通过松弛一般化误差界限、优化不平衡和平衡领域的经验风险、以及利用类内和类间距离来逼近域分歧,以可解释的方式将基于长尾分布的模型适应到一般分布中,实验结果验证了其在图像识别、物体检测和实例分割等方面达到了最先进的性能水平。
本文研究深度神经网络在视觉识别任务中长尾类别分布的建模问题,通过调整每个数据点的分类分数和平衡不同类别的数量来实现深度神经网络的统一分布校准策略,经过图像分类、语义分割、目标检测和实例分割等四个视觉识别任务的广泛实验验证,证明了该方法在简单统一框架下能够实现所有四个任务的最优结果。
Mar, 2021
本研究提出一种基于深度学习的视觉 - 语言长尾识别框架 (VL-LTR),并在图像文本双模态下解决了长尾数据识别问题,实验结果在 ImageNet-LT 数据集上表现优异,取得了 77.2% 的整体准确率,比之前最佳表现高出了 17 个百分点。
本文关注于长尾语义分割 (LTSS) 这一相对未经深入研究的任务设置,建立了三个代表性数据集,并提出了基于 Transformer 的改进算法,用于解决应用语义分割技术在自动驾驶和虚拟现实中遇到的长尾问题,并通过 LTSS 评估系统和基准进行性能展示,旨在推动对语义分割任务的实证研究。
Jun, 2024
本文提出了一个最综合的长尾学习基准 HeroLT,其中包含 13 种最先进的算法和 6 种评估指标,旨在从数据长尾性、各种领域的数据复杂性和新任务的异构性三个方面提供长尾学习的系统视图,并对未来的研究方向进行了探讨。
Jul, 2023