特征引入与干扰物感知的伪装物体检测
本文提出了一种新颖的上下文感知交叉级融合网络(C2F-Net),可以解决伪装对象检测(COD)任务。C2F-Net 采用注意力引导的跨级融合模块(ACFM)和双分支全局上下文模块(DGCM)进行高层特征处理,并在三个广泛使用的基准数据集上进行了大量实验,实验结果表明我们的模型优于现有的最先进模型。
May, 2021
本文提出了自适应引导学习网络(AGLNet),它是一种统一的可学习模型,用于在 CNN 模型中探索和调整不同的附加线索,以引导准确的伪装特征学习,并在不同的附加线索下实现了显著的性能改进。
May, 2024
我们提出了一种新颖的 “预训练、适应和检测” 方法,通过引入大型预训练模型,将从大量多模态数据中学习到的丰富知识直接转移到伪装对象检测任务中,使用轻量级并行适配器调整下游伪装对象检测任务的特征,通过在源任务上进行多任务适配器初始化和在目标任务上进行多任务调整,显著提高了我们模型的泛化能力。
Jul, 2023
本文提出了一种新颖的深度感知注意力融合网络,利用深度图作为辅助输入,增强网络感知三维信息的能力,从而改善伪装物体检测。通过使用特定的编码器提取色彩和深度信息,并引入深度加权的交叉注意力融合模块来动态调整深度和 RGB 特征图的融合权重。最后,采用简单而有效的特征聚合解码器自适应地融合改进的聚合特征。实验表明,我们提出的方法在伪装物体检测方面具有显著的优势,进一步验证了深度信息在其中的贡献。
May, 2024
我们提出了一种边界引导网络(BGNet)来进行伪装目标检测,该方法在三个数据集上都比现有技术高出很多,并利用边缘语义来引导特征学习,从而促进精确边界定位的伪装目标检测。
Jul, 2022
提出了一种名为 CoFiNet 的新方法,专注于多尺度特征融合与提取,通过细节特征的有效分割来提高其对伪装对象的检测能力,同时采用粗到细的策略、多尺度特征集成模块、多激活选择核模块和双掩模策略等技术手段,在四个不同数据集上进行了全面实验,证明了 CoFiNet 在伪装对象检测方面的出色性能和广泛应用潜力。
Feb, 2024
全文提供了对一项名为协作伪装目标检测(CoCOD)的新任务的全面研究,其目的是同时从一组相关图像中检测具有相同属性的伪装目标。为此,我们细致地构建了首个大规模数据集 CoCOD8K,该数据集包含 8528 张高质量且精选图像,带有目标遮罩注释,覆盖 5 个超类别和 70 个子类别。该数据集涵盖了各种自然和人工伪装场景,具有多样的目标外观和背景,因此对于 CoCOD 来说是一个非常具有挑战性的数据集。此外,我们提出了 CoCOD 的首个基准模型,名为双向分支网络(BBNet),该模型分别在单个图像内和图像组内探索和整合共伪装线索,以实现对给定图像中伪装目标的准确检测。这是通过一种图像间协作特征探索(CFE)模块、一种图像内目标特征搜索(OFS)模块和一种局部 - 全局细化(LGR)模块实现的。我们在提议的 CoCOD8K 数据集上对 18 种最先进的模型进行了性能评估,其中包括 12 种 COD 算法和 6 种 CoSOD 算法,采用了 5 种广泛使用的评估指标。广泛的实验表明了所提出方法的有效性以及与其他竞争方法相比显著更优越的性能。我们希望我们提出的数据集和模型能够促进 COD 社区的发展。该数据集、模型和结果将可在此网址获取: https://this-URL
Oct, 2023
Camouflaged object detection faces challenges, and this research proposes an adversarial training framework, Camouflageator, to generate more camouflaged objects and improve the detection. They also introduce ICEG, a novel COD method that utilizes internal coherence and edge guidance for better segmentation results. Experimental results show that ICEG outperforms existing detectors, and Camouflageator is flexible in improving various COD detectors, achieving state-of-the-art COD performance.
Aug, 2023
本文提出了一种基于人眼视觉感知的三阶段模型,它可以在单次迭代中进行粗到细的分割,并采用了多尺度特征增强和边界增强模块。此外,还使用了掩码引导并结合了粗略预测图与高分辨率特征图来生成细致的结果。我们的网络表现优于现有 CNN 模型,降低了计算开销并减轻了背景噪声干扰。
May, 2023