解耦的 DETR:空间分离定位和分类以改善端到端对象检测
本论文介绍了一种改进的 DETR 检测器,它采用了 “简洁” 的设计,使用单尺度特征图和全局交叉注意力计算,并没有特定的局部约束,与之前基于 DETR 的主要检测器相比,没有重新引入多尺度和局部性的架构偏好。我们展示了两种简单的技术在简洁设计中的出人意料的有效性,以弥补多尺度特征图和局部性约束缺失的问题。第一种是将盒子到像素相对位置偏差(BoxRPB)项添加到交叉注意力公式中,它很好地指导每个查询与对应的对象区域相互关注,并提供了编码灵活性。第二种是基于遮蔽图像模型(MIM)的骨干预训练,有助于学习具有细粒度定位能力的表示,并且对于补救对多尺度特征图的依赖是至关重要的。通过结合这些技术和最新的训练方法和问题形成策略,改进的 “简洁” DETR 检测器在原始 DETR 检测器的基础上取得了显著的改进。通过利用 Object365 数据集进行预训练,使用 Swin-L 骨干网络达到了 63.9 的平均精度(mAP),与依赖于多尺度特征图和基于区域的特征提取的最先进的检测器性能相媲美。代码在此 https URL 中提供。
Aug, 2023
该论文介绍了一种条件交叉注意力机制,名为条件 DETR,以应对目标检测中 DETR 训练速度较慢的问题,并通过实验证明,相较于传统的 DETR,条件 DETR 在训练速度上提升了 10 倍,并可通过 https 链接获取源代码。
Aug, 2021
Sparse Semi-DETR 是一种基于 Transformer 的端到端半监督目标检测解决方案,通过引入查询精化模块和可靠伪标签过滤模块来解决 DETR-based SSOD 框架中对象查询质量不准确和重叠预测的问题,大大提高了对小型和部分遮挡对象的检测能力,并在 MS-COCO 和 Pascal VOC 目标检测基准测试中实现了显著改进。
Apr, 2024
我们引入了 Cascade-DETR 用于高质量的通用目标检测,通过提出级联注意力层来共同解决对多样领域的泛化和定位准确性问题,通过限制关注先前的目标框预测来显式地将对象中心信息集成到检测解码器中。为了进一步提高准确性,我们重新审视了查询的评分,不依赖于分类分数,而是预测查询的预期 IoU,从而显著提高了置信度的校准性,最后,我们引入了一个包含来自多个领域的 10 个数据集的通用目标检测基准,UDB10,在 COCO 上也取得了最新的进展,Cascade-DETR 在 UDB10 的所有数据集上都对基于 DETR 的检测器有了显著的改进,有些甚至超过 10 个 mAP,严格质量要求下的改进效果更加显著。
Jul, 2023
本文提出 Semantic-Aligned-Matching DETR++(SAM-DETR++)算法,通过在同一特征嵌入空间中投影对象查询和编码图像特征以便更容易地匹配具有类似语义的对象。此算法有效地融合了多尺度特征,加速了 DETR 的收敛速度并提高了检测精度,拥有成为现有 DETR 收敛解决方案完美补充的潜力。
Jul, 2022
本文提出了一种改进的 FSOD 模型来解决样本不均衡和特征传播不足的问题,通过解耦基类和少样本类的参数以及引入编码器和解码器之间的跳跃连接,构建一个统一解码器模块,能够动态融合解码器的中间层作为输出特征,实验结果显示,在 PASCAL VOC 和 MSCOCO 等常用数据集上,我们的模型在微调和元学习范式中稳定提升了 5% 到 10%,并且超过了近期工作的最高得分。
Nov, 2023
通过引入分层显著性筛选细化和稳定的两阶段初始化查询模块,该研究论文在 DETR 类方法中取得了显著的性能提升,克服了规模偏差和语义不匹配的问题,并在多个任务特定的检测数据集上实现了 4.0% ~ 4.4% 的平均准确率(AP)提高以及在 COCO 2017 数据集上实现了 49.2% 的 AP 提高,并且使用更少的 FLOPs 达到了更高的计算效率。
Mar, 2024
本文提出了一种简单而有效的机制 —— 空间调制协同注意(SMCA),在检测变压器(DETR)中进行回归感知协同,以提高其收敛速度,并将多头和尺度选择注意设计集成到 SMCA 中,通过在 COCO 数据集上进行大量的消融研究,验证了 SMCA 的有效性。
Jan, 2021
引入一种基于等级的 DETR 目标检测器 Rank-DETR,通过一系列等级化设计,包括等级化架构设计和损失函数设计,提高了准确性和定位精度,并成功应用于最新的 SOTA 方法,展示了其有效性。
Oct, 2023
Sparse DETR 是第一个使用 Transformer 架构的完整目标检测器,其只更新预期被解码器引用的令牌,从而提高模型性能,使性能优于 Deformable DETR。
Nov, 2021