- 通过两阶段因果建模实现无偏场景图生成
本文提出了一种使用因果推理的场景图生成任务去偏置化的方法,其中包含两个阶段的因果建模,第一阶段是因果表示学习,第二阶段是自适应逻辑调整,实验结果表明该方法可以在头尾关系之间实现更好的平衡,达到最先进的性能表现。
- 协同学习与拼合相结合的多标签视觉识别技术
本文重点研究在含有噪声标签的长尾多标签视觉数据中如何降噪,提出了一种 Stitch-Up 数据增强方法和一个 Heterogeneous Co-Learning 框架,实现去噪和更健壮的表征学习。通过两个挑战性基准测试,VOC-MLT-No - 不平衡分类的扩展大间隔损失
本文提出了一种新的针对非均衡分类的损失函数 LDAM loss,同时提出了一种扩大较大边界的 ELM loss,并通过对非均衡 CIFAR 数据集和长尾分布大规模数据集的实验验证,证明了相较于标准的 LDAM loss 和传统的非均衡分类损 - LIVABLE:探索软件漏洞类型的长尾分类
本文提出了一个名为 LIVABLE 的长尾软件漏洞类型分类方法,该方法通过改进 GNN 传播步骤和采用自适应加权模块来解决长尾分布问题,以提高软件漏洞检测性能。
- CDLT: 面向细粒度视觉分类的带概念漂移和长尾分布的数据集
为实现精细视觉分类技术的实际推广,创造了一个概念漂移和长尾分布数据集,其中 11195 张图片在 47 个连续月中收集,使用了最先进的分类模型进行了广泛的基线实验。
- 不完美环境下的学习:长尾分布和部分标签的多标签分类
本文介绍了一种新颖的任务,即 Partial labeling and Long-Tailed Multi-Label Classification(PLT-MLC),并提出了一种端到端的学习框架 CO-MIC-Balance(Correc - 从头到尾传递知识:长尾分布下的不确定性校准
本论文研究如何从长尾分布的样本中训练模型并校准,利用知识转移和重要性权重估算方法,将尾部类别的目标概率密度适应地从头部类别中传输,实现了长尾分布校准,并在多个数据集上证实了该方法的有效性。
- CVPR通过自异构整合与知识挖掘实现长尾视觉识别
这篇文章提出了一种基于深度神经网络的 MoE 模型 ——Self-Heterogeneous Integration with Knowledge Excavation(SHIKE)来解决长尾分布的问题,模型采用 Depth-wise Kn - CVPR视频中无偏场景图生成
该研究提出了一个名为 TEMPURA 的框架,通过基于 Transformer 的序列建模,学习合成无偏差的关系表示,并使用高斯混合模型来减少视觉关系的预测不确定性,从而解决视频动态场景的场景图生成中存在的多种问题。该方法在生成更加无偏的场 - 针对面向字符级别长尾分布的场景文本识别改进
本研究提出了一种基于上下文感知模型和自由专家网络的场景文字识别系统,对字数众多的中国和韩国等语言的字符识别性能有较大提升,并且易于应用于各种场景文字识别模型。
- 野外文本分类:大规模长尾姓名标准化数据集
本文研究机构名称的规范化问题,针对实际数据应用中存在的长尾分布情况,提出了一个包含超过 25k 类的长尾数据集 LoT-insts1,并进行了基于搜索方法和 Bert 模型的神经网络等多种方法的基准测试及提出了一种特殊的 Bert 模型,在 - 不偏场景图生成的偏斜类平衡重新加权
提出一种名为 Skew Class-balanced Re-weighting(SCR)的无偏场景图生成(SGG)算法,以考虑长尾分布造成的无偏谓词预测,并使用 SCR 损失函数来更好地权衡大多数和少数谓词表现,通过在标准视觉基因组数据集和 - 面向长尾多标签文本分类的成对实例关系增强
本文通过提出一种 Pairwise Instance Relation Augmentation Network (PIRAN) 的方法,实现多标签文本分类中少样本标签的平衡和预测性能的提高。通过使用多标签文本数据集进行实验,证明 PIRA - ECCV长尾类别增量学习
本文提出了两种长尾分布的增量学习场景,研究了在这两个场景下现有方法的表现,并提出了一种包含学习可调权重层的两阶段基线,用于减少由长尾分布引起的偏差,同时提高常规增量学习的性能。在 CIFAR-100 和 ImageNet-Subset 上, - SoLar: Sinkhorn 标签提炼在不平衡偏标签学习中的应用
提出了基于最优传输的 SoLar 框架作为 PLL 问题的解决方案,该框架可用于弱监督情况下部分标签学习中的标签消岐,特别是在面对长尾分布和标签不完整情况下,该方法比先前的最新 PLL 方法表现出更高的性能。
- ECCVPoseTrans: 一种简单而有效的姿势变换数据增强方法,用于人体姿态估计
本研究提出了一种简单而有效的数据增强方法,称为姿势变换模块 (PoseTrans),旨在解决人体姿势数据分布不均的问题,提高当前姿态估计器的泛化能力和效率。实验结果表明,我们提出的方法在稀有姿势方面表现出色,易于实现。
- ICML带有增强记忆的对比学习
本研究提供一种从数据角度出发的 Boosted Contrastive Learning (BCL) 方法用于自监督长尾学习,以识别长尾分布的尾部数据,通过深度神经网络来自动驱动样本视图的信息差异,从而增强了标签无关情境下的长尾学习效率,并 - IJCAI通过联邦特征重训练进行异构和长尾数据的联邦学习
本文提出了一种新型的隐私保护联邦学习方法,通过分类器重新训练实现异构和长尾数据的隐私保护联邦特征,可在不泄露本地数据或类分布信息的情况下产生与真实数据上重新训练后的分类器相当的性能。实验结果表明,该方法是一种有效的解决方案,可在异构和长尾数 - CVPR如何进行细粒度行为理解:利用伪副词
本研究提出一种半监督学习方法来识别动词的副词,用于了解不同行为之间微小的差异,具有很强的实证效果。
- AAAI通过推理想象:一种基于推理的隐式语义数据增强方法,用于长尾分类
本文提出了一种新颖的基于推理的隐性语义数据增广方法来缓解长尾分布数据分类算法性能下降的问题,并通过构建协方差矩阵和知识图谱,从相似类别中采样新方向来生成新的样本实例,从而适应性增强长尾数据,实验证明该方法有效。