- SMCL:用于长尾识别的显著性掩蔽对比学习
本文提出了一种新的方法,利用显著性遮罩和对比学习来减轻训练不平衡数据的问题并提高模型的泛化能力,在特征空间中将遮罩图像移向次要类别,以减少与原始类别相关的背景特征。实验证明,我们的方法在基准长尾数据集上获得了最先进的性能水平。
- 梯度感知的对数调整损失函数用于长尾分类器
我们提出了梯度感知的逻辑调整(GALA)损失和预测再平衡策略来解决长尾数据问题,并在多个数据集上实验证明了其有效性。
- SFC:弱监督语义分割中的共享特征校准
在这项研究中,我们首次证明了训练数据中存在的长尾分布会导致通过分类器权重计算出的 Class Activation Mapping 对头部类别过度激活、尾部类别欠激活,从而降低伪标签的质量并进一步影响最终的语义分割性能。为了解决这个问题,我 - 针对长尾半监督学习的不确定性感知采样
基于不确定性感知的动态阈值选择 (UDTS) 方法解决了半监督学习中类别不平衡的问题,通过引入模型预测的不确定性来调整伪标签选择阈值,提高了模型在长尾类别上的准确性。
- 多模态亲和推断弱监督 3D 语义分割
本文提出了一种简单而有效的基于场景级弱监督的点云分割方法,引入了多模态点亲和度推理模块,利用从多个模态(如点云和 RGB)得到的特征来特征化提出的点亲和度,并通过归一化分类器权重来减轻长尾分布的不利影响,无需事先知道类别分布的先验信息。通过 - AAAI揭示组成式零样本学习中的近邻长尾分布
将组合零样本学习转化为相对类别不平衡问题,通过估计视觉偏差作为类别先验来训练分类器,以获取更可辨别的类原型,从而提高模型性能。
- 利用检索增强学习改进生物医学实体链接
通过引入新的 $k$NN-BioEL 方案,以及使用动态难负采样 (DHNS) 进行对比学习,本研究提出了一种改进型的生物医学实体链接模型,可以提高模型对稀有和困难实体的处理能力,并在多个数据集上优于现有方法。
- ICCV长尾识别的广义类别发现
通过研究基于长尾分布的广义类别发现 (Long-tailed GCD) 范式,以及支持稀有类别和预期类别分布的重新加权机制和类先验约束,我们提出的方法在 ImageNet100 上实现了约 6-9% 的改善,并在 CIFAR100 上取得了 - 非参数贝叶斯推断的元学习神经回路
从非参数贝叶斯模型中提取归纳偏好并将其转移到人工神经网络,使得神经电路能够在开放类集合上成功进行顺序推理,实现了与基于粒子滤波器方法相当甚至更好的性能,并且速度更快、使用更简单。
- 长尾学习作为多目标优化
通过多目标优化,我们提出一种梯度平衡聚类(GBG)策略,以应对现实世界数据中的类别不平衡和长尾分布问题,并在长尾学习中展现出比现有方法更优越的性能。
- 几何调和解决表征学习差异
在应对长尾分布的真实世界应用中,我们提出了一种新颖的几何调和(GH)方法,通过在表示学习中鼓励类别级别的均匀性,更有利于少数类别,几乎不损害大多数类别,从而解决了现有方法难以获得可迁移和稳健表示的问题。
- 视频中无偏场景图生成的相关性去偏
FloCoDe 通过使用流进行特征扭曲以检测帧间时间一致的对象,并使用相关性去偏学习长尾类别的无偏关系表示,通过混合 sigmoid 交叉熵损失和对比损失以缓解预测不确定性,实现生成更加无偏的场景图,性能提升高达 4.1%。
- Fed-GraB: 基于自适应梯度均衡器的联邦长尾学习
此研究论文介绍了一种名为 Fed-GraB 的方法,通过在全局范围内聚合本地异构数据集并调整本地学习策略,基于全局长尾分布的反馈,实现了在保持多数类性能的同时,在少数类上取得更好性能的全局模型,并在 CIFAR-10-LT、CIFAR-10 - TDCGL: 两级去偏对比图学习用于推荐
本研究提出了基于知识图谱的推荐方法存在对高质量知识图谱的过度依赖问题,并介绍了两级无偏对比图学习(TDCGL)模型,该模型通过引入对比学习和降噪方法,解决了实体分布不均和噪声问题,从而提高推荐模型的性能。
- 一种用于长尾识别的具有互分支和内分支对比损失的双分支模型
本文介绍了一种名为双分支长尾识别(DB-LTR)的简单而有效的模型,它包括一个不平衡学习分支和一个对比学习分支(CoLB),通过利用常见的不平衡学习方法来解决数据不平衡问题,并通过对比学习分支来改善模型对尾部类别的适应能力,并学习出一个具有 - SAILOR: 结构增强的基于尾节点表示学习
利用结构增强的基于长尾分布的图神经网络模型(SAILOR)可以改善尾节点表达并超越现有基准模型。
- 多模视觉动作识别的集成建模
我们在这项工作中提出了一种用于多模态动作识别的集成建模方法,通过使用适应 MECCANO 数据集的长尾分布的变种焦点损失模型,独立训练各个模态的模型,并基于焦点损失的基本原理,提出了一种指数衰减的焦点损失模型,它能够根据数据集中的所有示例逐 - CheXFusion: 多视角特征有效融合用于长尾胸部 X 射线分类的转换器
本研究通过引入 CheXFusion,一个基于 transformer 的融合模块,结合多视图图像处理,通过自注意力和交叉注意力机制,高效聚合多视图特征并考虑标签的共现作用,进一步探索数据平衡和自训练方法以提高模型性能,在 MIMIC-CX - 一种记忆增强的多任务协作框架,用于无监督驾驶视频中的交通事故检测
通过多任务协作的记忆增强框架(MAMTCF)来无监督地检测驾驶视频中的交通事故,同时对外观变化和目标运动建模,取得了比现有方法更好的性能。
- 长尾分布上的对抗性训练
本文研究了在服从长尾分布的数据集上的对抗训练,相较于平衡数据集上的对抗训练,该过程会产生不均匀的对抗性样本和不平衡的特征嵌入空间,导致模型对尾部数据的鲁棒性和准确性低。为了解决这一问题,我们提出了一种新的对抗训练框架 —— 再平衡对抗训练(