利用背景信息降低分类激活的不确定性
本研究针对深度学习模型的解释提出了一种方法,通过梯度获取与误分类样本更相关的确信度估计和提供视觉注意力图,特别是在视觉问答任务中,该方法采用现代概率深度学习方法,并进一步通过这些估计梯度进行改进,得到具有人类注意区域相关性的先进的注意力图,从而提供了更好的解释能力。我们在所有标准基准测试上提供了详细的实证分析和与现有方法的比较。
Aug, 2019
基于 Conformer 的 TransCAM 方法在弱监督语义分割中解决了背景噪声的问题,减少了背景噪声的影响,提高了伪标签的准确性。在实验中,我们的模型在 PASCAL VOC 2012 验证数据上达到了 70.5% 的分割性能,在测试数据上达到了 71.1% 的分割性能,在 MS COCO 2014 数据上达到了 45.9% 的分割性能,优于 TransCAM 方法。
Apr, 2024
本论文提出了一种端到端可训练的特征增强模块,用于图像分类,它提取并利用多视角局部特征来提高模型性能,并结合自适应类别激活映射(AdaCAM)以及辅助分类器头,以通过采样类典型的局部特征来有效地关注类别鉴别性局部区域,进而提高模型对抗性和鲁棒性。大量实验证明,我们的多视角特征增强模块具有一致且显著的性能提升。
Jun, 2022
本研究旨在评估图像中某个标签的特定区域的定量信息内容,使用信息论来实现类激活映射和信息的桥梁,同时开发了一种信息化类激活映射 (infoCAM)。应用于图像分类任务中,infoCAM 可以更好地执行弱监督目标定位任务,实现了在 Tiny-ImageNet 中的最新研究结果。
Jun, 2021
本文研究基于类激活映射(CAM)的弱监督物体定位方法中偏置激活的问题,分析了其原因,基于此设计了一个新的 Counterfactual Co-occurring Learning(CCL)范例,并将 Counterfactual-CAM 集成进了模型中,通过合理设计网络结构,成功地减少了干扰信息的影响,并在多个基准测试中实现了精确的物体定位。
May, 2023
本文介绍了基于深度强化学习的主动学习框架,旨在最大限度地提高医学影像分类器性能,同时减少对数据采集和标记所需的时间和专业知识。该框架通过修改深度 - Q 网络公式,基于几何参数在分类器的潜在空间中挑选数据,实现了高准确性的多类别分类。同时,我们还将该框架应用于两个医学图像数据集,并与标准查询策略以及最新的基于强化学习的主动学习方法进行了比较。
Jun, 2022
深度学习中越来越需要可解释的 AI。我们的工作旨在将来自较早和较晚网络层的信息结合起来,产生具有竞争力的高分辨率 Class Activation Map,从而准确定位图像特征,从而超越以前的艺术水平。
Apr, 2022
提出了基于集成的 MetaCAM 方法,结合多种现有的 Class Activation Maps 方法,通过对组件 CAMs 中最高激活像素的前 k% 的一致性进行集成,优化了深度学习模型预测中显著区域的定位性能,并通过自适应阈值方法改善了 CAMs 的性能。
Jul, 2023
本文从数据增强和弱监督学习的角度研究了变化检测的泛化问题,提出了一种基于背景混合数据增强和虚假标签的弱监督训练方法,并设计了一种增强数据一致性损失以显著提高模型的泛化能力。经过广泛的实验验证,在两个公共数据集中,该方法可以增强四种最先进的变化检测方法,证明了它的优势。
Nov, 2022
本文提出了一种基于 UM-CAM 的新型弱监督学习方法,利用语义特征和上下文信息探测,解决了采用图像级标签的弱监督分割方法中出现的活跃区域不完整的问题,对于胎儿脑分割任务取得了良好的性能。
Jun, 2023