FocusDiffuser:感知伪装目标检测中的局部差异
本文提出了一种基于缩放网络的对象分割模型ZoomNet,采用缩放策略、混合尺度单元和层级混合尺度单元学习圈定隐藏目标并能够适应模糊的背景干扰,用不确定性感知损失提高模型在候选区域中的预测准确度,大幅超越其他23种最先进的模型,在SOD任务上也取得了最优效果。
Mar, 2022
该论文提出了一种基于AI-Generated Content的CamDiff方法,利用latent diffusion model综合伪装场景中的显著物体来生成更具有代表性的伪装样本,其结果表明,该方法能够吸引用户的关注并对现有的COD模型提出更大的挑战。
Apr, 2023
本文提出了一种基于人眼视觉感知的三阶段模型,它可以在单次迭代中进行粗到细的分割,并采用了多尺度特征增强和边界增强模块。此外,还使用了掩码引导并结合了粗略预测图与高分辨率特征图来生成细致的结果。我们的网络表现优于现有CNN模型,降低了计算开销并减轻了背景噪声干扰。
May, 2023
在计算机视觉中,把伪装目标检测(Camouflaged Object Detection,COD)视为基于扩散模型的条件掩蔽生成任务,提出了一种名为 CamoDiffusion 的方法,它使用扩散模型的去噪过程来迭代地减少掩蔽的噪声,其随机采样的过程使得其模型能够从掩蔽分布中采样多个可能的预测,避免了过分预测错误的问题,该文的实验表明,与现有最先进的方法相比,在三个COD数据集上,特别是在最具挑战性的COD10K数据集上,我们的方法达到了0.019的MAE(平均绝对误差),表现出优越的性能。
May, 2023
通过数据级矛盾建模和任务级矛盾建模,引入不确定性感知学习流程,从而在突显物体检测和伪装物体检测任务中充分探索矛盾信息。为了更好地理解这两个任务的不确定性,我们广泛研究了不确定性估计技术,以实现对每个任务的困难区域进行有效估计和学习。实验结果表明,我们的解决方案在基准数据集上取得了最先进的性能和有意义的不确定性估计。
Jul, 2023
本研究提出了一种基于扩散的伪装目标检测框架(diffCOD),该框架将伪装目标分割任务视为从噪声掩码到目标掩码的去噪扩散过程,并采用模型学习来逆转这一噪声处理过程。通过将输入图像先验编码和集成到去噪扩散模型中来加强去噪学习,同时使用注入注意力模块(IAM)通过交叉注意机制将从图像中提取的条件语义特征与扩散噪声嵌入相互作用以增强去噪学习。实验结果表明,在四个广泛使用的伪装目标检测基准数据集上,该方法相较于其他11种最先进的方法,尤其在伪装目标的纹理细分割上取得了有利的性能。
Aug, 2023
提出了一个框架,利用生成模型合成伪装图像以增强自然场景中伪装物体的检测能力。该方法利用一个伪装环境生成器和伪装分布分类器来合成伪装图像,并通过生成模型扩展数据集。实验证明该框架在改善伪装物体检测方面优于现有方法,并为现有伪装数据集引入更多多样性和分布。
Aug, 2023
我们提出了一种有效的统一协同金字塔网络用于实现对伪装物体的检测,通过模拟人类行为中的缩放策略来学习具有辨别能力的多尺度语义,并利用富含的粒度感知单元来充分探索候选物体和背景环境之间的不可察觉线索,并结合不确定性意识损失来增强对候选区域的高置信度预测,该方法在图像和视频伪装物体检测基准中始终优于现有的最先进方法。
Oct, 2023
本文提出了一种新颖的深度感知注意力融合网络,利用深度图作为辅助输入,增强网络感知三维信息的能力,从而改善伪装物体检测。通过使用特定的编码器提取色彩和深度信息,并引入深度加权的交叉注意力融合模块来动态调整深度和RGB特征图的融合权重。最后,采用简单而有效的特征聚合解码器自适应地融合改进的聚合特征。实验表明,我们提出的方法在伪装物体检测方面具有显著的优势,进一步验证了深度信息在其中的贡献。
May, 2024
本研究针对伪装物体检测(COD)这一计算机视觉中的重要挑战,提供了最全面的回顾,涵盖了理论框架及实践贡献。通过研究多种COD方法,本论文揭示了现有模型的局限性,并提出了九个未来研究的前沿方向,旨在推动该领域的发展。
Aug, 2024