- DVF: 提升鲁棒性和准确性的细粒度图像检索与检索指南
本文提出了实用的细粒度图像检索模型设计指南,包括强调对象、凸显子类别特异性差异以及采用有效的训练策略。通过遵循指南并设计了一种新颖的双重视觉过滤机制(DVF),本文在三个广泛使用的细粒度数据集上实现了最先进的性能表现。
- MambaMIL: 在计算病理学中通过序列重新排序来增强长序列建模
通过在多实例学习(MIL)中引入选择性扫描空间状态顺序模型(Mamba),提出了具有线性复杂度的长序列建模的 MambaMIL。通过继承香草 Mamba 的能力,MambaMIL 能够全面理解和感知实例的长序列,并借助序列重新排序的 Mam - 大规模更稳健可解释的视觉任务的层次不变性
构建鲁棒且可解释的视觉系统是实现可信人工智能的重要步骤。本研究从理论、实践和应用角度系统地研究了层次不变性,并提出了一种使用卷积神经网络(CNN)层次结构构建超完备不变性的可解释方法。通过实验证明,该方法在纹理、数字和寄生虫分类等实验中展示 - 深入探究暗区以实现强鲁棒阴影检测
通过学习全局环境下的背景特征,并聚焦于暗区域,我们提出了一种新的阴影检测方法,优于现有方法,并在三个主流阴影检测数据集上进行了广泛实验验证。
- 通过单目相机在反射地面上进行室内障碍物探测
通过预测地面平面并利用地面像素视差来进行障碍物发现,解决了反射地面导致的自主导航失败问题。提出了一种统一的外观几何特征表达方法,并设计了融合器来发现障碍物。在新的数据集上验证了该方法的优越性能。
- X2-Softmax:人脸识别的边界自适应损失函数
该论文提出了一种新的角度自适应边界损失函数 X2-Softmax,通过增加类别之间的角度来提供自适应边界,从而提高人脸识别的效果。
- MMCUCL: 无监督连续学习的代码手册
本研究主要关注无监督连续学习(Unsupervised Continual Learning,UCL),提出了一种名为 Codebook for Unsupervised Continual Learning(CUCL)的方法,通过注入多样 - 基于动态相似邻接矩阵的车辆再识别图网络
基于动态相似邻接矩阵的图网络(DSAM-GN)是一种用于车辆再识别的新方法,通过构建邻接矩阵来捕捉局部特征的空间关系和减少背景噪声,提取更具差别性的特征。实验证明,DSAM-GN 方法相比于其他近期研究在公共数据集上具有更好的效果。
- 通过逐渐增加难度的负样本学习进行自动放射学报告生成
本文提出了一种新的框架,通过逐步提高每个图像在特征空间中的更难负面反馈的难度,从而学习区分性图像和报告特征,以生成更特定和准确的医疗报告,实验证明这种方法可以作为插件轻松地改进现有的医学报告生成模型。
- 面向小型 Logo 检测的跨方向任务解耦网络
本文提出了一种名为 Cross-direction Task Decoupling Network (CTDNet) 的小型 LOGO 检测算法,使用 Cross-direction Feature Pyramid (CFP) 实现横向和纵 - 预训练特征提取器中的适配器学习,用于疾病的持续性学习
提出了一种基于适配器的策略,利用可学习的轻量级任务特定适配器和新的任务特定头以及对以前的知识进行 “out-of-distribution” 处理,解决了智能诊断系统更新新疾病数据时遗忘旧疾病知识的问题,并通过在三个图像数据集上的广泛实证评 - AAAI基于不确定性调控的双记忆单元弱监督视频异常检测
提出使用 Uncertainty Regulated Dual Memory Units 模型及 Global and Local Multi-Head Self Attention 模块来强化通过建立正常状态的描述从而更好地区分异常数据的 - KDDCOSTA: 基于协方差保持的图对比学习特征增强
本文提出了一种基于 COvariance-preServing feaTure space Augmentation (COSTA) 的图对比学习 (Graph Contrastive Learning) 方法,通过在隐藏特征层面上进行特征 - ElasticFace:用于深度人脸识别的弹性边缘损失
本文旨在提高面部识别模型的鉴别能力,并提出弹性惩罚边缘损失 (ElasticFace) 来放松固定惩罚边缘的限制,该方法采用每个训练迭代中从正态分布中绘制的随机边缘值,以提高面部识别性能。
- ICCV基于分组抑制的特征正则化方法用于鲁棒分类
提出了一种使用组间抑制(group-wise inhibition)的卷积神经网络(CNN)正则化方法,通过处理具有不同激活分布的特征映射来考虑特征独立性,以实现对于严峻环境如腐败、对抗样本和低数据区域的稳健分类。
- 远程感知图像任意方向物体检测的关键特征捕获网络 CFC-Net
本文提出了一种名为 CFC-Net 的网络,该网络使用判别式特征来提高遥感图像中对象的检测精度,并通过构建强大的特征表示、优化预设锚点和优化标签分配等方面来改进检测性能。实验结果表明,在三个远程感应数据集中,与许多最先进的方法相比,该方法实 - ECCV基于语义引导部位注意力网络的方向感知车辆再识别
提出了一种基于语义标签训练的、能够较为准确地预测车辆不同视角部分的注意力掩码的 Semantics-guided Part Attention Network (SPAN) 模型,结合 Co-occurrence Part-attentiv - 用于鲁棒的基于骨架的动作识别的 Richly Activated Graph Convolutional Network
该论文提出了基于骨架的动作识别方法,采用了多流图卷积网络来提高模型的鲁棒性,学习到所有骨架关节的最优特征,显著减轻了由于遮挡和干扰骨架关节导致的性能下降。
- 深度神经网络特征可视化的显著性驱动类别印象
该论文提出了一种用于从分类器的内存中提取每个类别的印象的数据无关方法,通过一种基于显著性驱动的可视化方法展示了深度学习分类器在训练数据中提取的判别特征,帮助提高生成图像的置信度。
- ECCV挑战感知的 RGBT 跟踪
本文提出了一种新的挑战感知神经网络来处理 RGBT 跟踪中的共享和特异性挑战,包括对模态共享和模态特异性挑战进行聚合和并行嵌入到骨干网络中以有效地形成更具区分性的目标表示。