GLCONet：学习多源感知表示以检测伪装物体

Sep, 2024

GLCONet：学习多源感知表示以检测伪装物体

GLCONet: Learning Multi-source Perception Representation for Camouflaged Object Detection

Yanguang Sun, Hanyu Xuan, Jian Yang, Lei Luo

TL;DR本研究解决了伪装物体检测中的长程依赖问题，提出了一种新的全球局部协同优化网络（GLCONet），能够同时建模局部细节和全局长范围关系，从而提高检测精度。实验结果表明，GLCONet在多个公共数据集上显著优于二十种最先进的方法，展示了其在生成高质量表示方面的潜力。

Abstract

Recently, biological perception has been a powerful tool for handling the Camouflaged Object Detection (COD) task. However, most existing methods are heavily dependent on the local spatial information of diverse scales from convolutional operations to optimize initial features. A commo

发现论文，激发创造

同时定位、分割和排列伪装物体

本研究通过建立Rank-Net模型，结合 camouflaged object detection技术和conspicuousness 的概念，来探讨动物进化中的Camouflage技术，并提出一个可以定位、分割和排名Camouflaged目标的方法。实验结果表明，该模型取得了新的最先进水平，使Camouflaged目标的检测更具可解释性。

Mar, 2021

放大和缩小：一种混合尺度三元组网络用于伪装目标检测

本文提出了一种基于缩放网络的对象分割模型ZoomNet，采用缩放策略、混合尺度单元和层级混合尺度单元学习圈定隐藏目标并能够适应模糊的背景干扰，用不确定性感知损失提高模型在候选区域中的预测准确度，大幅超越其他23种最先进的模型，在SOD任务上也取得了最优效果。

Mar, 2022

CamDiff: 基于扩散模型的伪装图像增强技术

该论文提出了一种基于AI-Generated Content的CamDiff方法，利用latent diffusion model综合伪装场景中的显著物体来生成更具有代表性的伪装样本，其结果表明，该方法能够吸引用户的关注并对现有的COD模型提出更大的挑战。

Apr, 2023

一个仿生三阶段模型用于伪装目标检测

本文提出了一种基于人眼视觉感知的三阶段模型，它可以在单次迭代中进行粗到细的分割，并采用了多尺度特征增强和边界增强模块。此外，还使用了掩码引导并结合了粗略预测图与高分辨率特征图来生成细致的结果。我们的网络表现优于现有CNN模型，降低了计算开销并减轻了背景噪声干扰。

May, 2023

特征引入与干扰物感知的伪装物体检测

本研究提出了一种新的特征融合和多干扰物注视的网络，用于解决融入环境中的伪装目标检测问题，并通过自行构建的ACOD2K数据集验证其性能。

Jul, 2023

协作伪装对象检测：大规模数据集和基准测试

全文提供了对一项名为协作伪装目标检测（CoCOD）的新任务的全面研究, 其目的是同时从一组相关图像中检测具有相同属性的伪装目标。为此，我们细致地构建了首个大规模数据集 CoCOD8K，该数据集包含8528张高质量且精选图像，带有目标遮罩注释，覆盖5个超类别和70个子类别。该数据集涵盖了各种自然和人工伪装场景，具有多样的目标外观和背景，因此对于CoCOD来说是一个非常具有挑战性的数据集。此外，我们提出了CoCOD的首个基准模型，名为双向分支网络（BBNet），该模型分别在单个图像内和图像组内探索和整合共伪装线索，以实现对给定图像中伪装目标的准确检测。这是通过一种图像间协作特征探索（CFE）模块、一种图像内目标特征搜索（OFS）模块和一种局部-全局细化（LGR）模块实现的。我们在提议的CoCOD8K数据集上对18种最先进的模型进行了性能评估，其中包括12种COD算法和6种CoSOD算法，采用了5种广泛使用的评估指标。广泛的实验表明了所提出方法的有效性以及与其他竞争方法相比显著更优越的性能。我们希望我们提出的数据集和模型能够促进COD社区的发展。该数据集、模型和结果将可在此网址获取: https://this-URL

Oct, 2023

ZoomNeXt: 一种统一的协作金字塔网络用于伪装物体检测

我们提出了一种有效的统一协同金字塔网络用于实现对伪装物体的检测，通过模拟人类行为中的缩放策略来学习具有辨别能力的多尺度语义，并利用富含的粒度感知单元来充分探索候选物体和背景环境之间的不可察觉线索，并结合不确定性意识损失来增强对候选区域的高置信度预测，该方法在图像和视频伪装物体检测基准中始终优于现有的最先进方法。

Oct, 2023

VSCode：基于2D提示学习的通用视觉突显和伪装物体检测

基于 VSCode 模型和 2D prompt 学习的引入，共同解决了四个显著目标检测任务和三个伪装目标检测任务，实现了在26个数据集上六个任务的最优结果，并通过结合2D prompts，如RGB-D COD，呈现了对未见任务的零样本泛化能力。

Nov, 2023

深度唤醒：一种 RGB-D 伪装物体检测的深度-感知-注意力融合网络

本文提出了一种新颖的深度感知注意力融合网络，利用深度图作为辅助输入，增强网络感知三维信息的能力，从而改善伪装物体检测。通过使用特定的编码器提取色彩和深度信息，并引入深度加权的交叉注意力融合模块来动态调整深度和RGB特征图的融合权重。最后，采用简单而有效的特征聚合解码器自适应地融合改进的聚合特征。实验表明，我们提出的方法在伪装物体检测方面具有显著的优势，进一步验证了深度信息在其中的贡献。

May, 2024

FocusDiffuser：感知伪装目标检测中的局部差异

探测伪装物体是一项复杂任务，而目前的研究主要涉及到使用辨别模型和生成模型。本研究提出了一种新的去噪扩散模型FocusDiffuser，通过集成专门优化模块，有效提高了难以察觉的伪装物体的检测和解释能力。实验证明，从生成模型的视角来看，FocusDiffuser显著超越了CAMO、COD10K和NC4K等基准模型，有效应对了伪装物体检测的挑战。

Jul, 2024