DiffusionDet: 目标检测的扩散模型
本文提出了DiffusionSeg框架,利用预训练和扩散模型实现无监督物体发现,并采用合成-利用两阶段策略来缓解数据不足和结构差异问题,采用反演技术将图像映射回扩散特征,通过大量实验验证了该方法的优越性。
Mar, 2023
本研究提出了一种基于扩散的伪装目标检测框架(diffCOD),该框架将伪装目标分割任务视为从噪声掩码到目标掩码的去噪扩散过程,并采用模型学习来逆转这一噪声处理过程。通过将输入图像先验编码和集成到去噪扩散模型中来加强去噪学习,同时使用注入注意力模块(IAM)通过交叉注意机制将从图像中提取的条件语义特征与扩散噪声嵌入相互作用以增强去噪学习。实验结果表明,在四个广泛使用的伪装目标检测基准数据集上,该方法相较于其他11种最先进的方法,尤其在伪装目标的纹理细分割上取得了有利的性能。
Aug, 2023
提出了一种简单但健壮的框架,将物体检测和关联作为从配对噪声框到配对真实框的一致去噪扩散过程来联合建模,通过新颖的渐进去噪扩散策略大幅提升了跟踪器的效果,在推理中,模型通过灵活的一步或多步去噪扩散过程,将一组随机生成的配对框优化为检测和跟踪结果,大范围实验证明了该方法在多个MOT基准测试上与当前最先进的方法相当。
Aug, 2023
Diff3Det使用扩散模型进行3D物体检测的提案生成,通过将检测框视为生成目标,在训练过程中将物体框从真实框扩散到高斯分布,并学习解码器逆转这个噪声过程。推理阶段,模型逐渐将一系列随机框细化为预测结果,在KITTI基准测试上表现出有希望的性能,相较于经典的基于锚点的3D检测方法。
Sep, 2023
最近开发的扩散模型是一个可扩展的数据引擎用于物体检测,作者提出了一个数据扩展引擎 DiffusionEngine(DE) 用于在一个阶段中提供高质量的检测训练对。扩散引擎 DE 由一个预先训练好的扩散模型和一个有效的检测适配器构成,能够以即插即用的方式生成可扩展、多样化和具有通用性的检测数据,在各种场景下能够显著提升检测算法的结果。
Sep, 2023
DiffRef3D是一种新颖的框架,采用了首次将扩散流程应用于使用点云的三维物体检测,通过将噪声逐渐添加到提案和目标物体之间的残差,并将噪声残差应用于提案以生成假设,然后通过迭代步骤对假设进行精确的盒子预测,从而在现有的三维物体检测模型中持续改进性能。
Oct, 2023
利用最先进的实地图像生成方法,Gen2Det提出一个简单的模块化流程来创建用于对象检测的免费合成训练数据,包括图像级过滤、实例级过滤和改进的训练配方以应对生成中的缺陷,并在各种设置下对对象检测和分割任务显示出良好的改进。
Dec, 2023
通过利用一种自洽模型的创新去噪概念,我们引入了一个被称为ConsistencyDet的新框架,用以将目标检测作为一个去噪扩散过程来表述。在训练阶段中,ConsistencyDet使用从地面实况注释衍生的噪声注入框开始扩散序列,并调节模型执行去噪任务。综合评估表明,ConsistencyDet在性能指标方面超越了其他领先的检测器。
Apr, 2024
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后,作者指出当前扩散模型的局限性,并提出了未来研究的七个有趣方向。这篇综述论文旨在加深人们对于在低层次视觉任务中的去噪扩散模型领域的全面理解。
Jun, 2024