Align-DETR: 使用简单的 IoU 感知 BCE 损失来改进 DETR

Apr, 2023

Align-DETR: 使用简单的 IoU 感知 BCE 损失来改进 DETR

Align-DETR: Improving DETR with Simple IoU-aware BCE loss

Zhi Cai, Songtao Liu, Guodong Wang, Zheng Ge, Xiangyu Zhang...

TL;DR提出了一种改进的检测算法 Align-DETR，通过引入一个新的指标来解决 DETR 算法的 misalignment problem，该算法采用的 IA-BCE 损失函数可以有效训练定位精度与分类分数之间的关系，利用 prime sample weighting 机制抑制不重要样本的干扰，最终在 COCO 数据集上取得了 50.2% 的 AP 表现。

Abstract

detr has set up a simple end-to-end pipeline for object detection by formulating this task as a set prediction problem, showing promising potential. However, despite the significant progress in improving

detr object detection misalignment problem localization precision prime sample weighting

发现论文，激发创造

具有稳定匹配的检测变压器

探讨 DETR 中跨不同解码器层次的匹配稳定性问题，提出使用位置度量监督正样本的分类得分和集成位置度量到 DETR 的分类损失和匹配代价中的两种方法，并在 COCO 检测基准测试中验证其有效性。

Apr, 2023

高质量物体检测的 Rank-DETR

引入一种基于等级的 DETR 目标检测器 Rank-DETR，通过一系列等级化设计，包括等级化架构设计和损失函数设计，提高了准确性和定位精度，并成功应用于最新的 SOTA 方法，展示了其有效性。

Oct, 2023

级联 DETR：深入高质量的通用目标检测

我们引入了 Cascade-DETR 用于高质量的通用目标检测，通过提出级联注意力层来共同解决对多样领域的泛化和定位准确性问题，通过限制关注先前的目标框预测来显式地将对象中心信息集成到检测解码器中。为了进一步提高准确性，我们重新审视了查询的评分，不依赖于分类分数，而是预测查询的预期 IoU，从而显著提高了置信度的校准性，最后，我们引入了一个包含来自多个领域的 10 个数据集的通用目标检测基准，UDB10，在 COCO 上也取得了最新的进展，Cascade-DETR 在 UDB10 的所有数据集上都对基于 DETR 的检测器有了显著的改进，有些甚至超过 10 个 mAP，严格质量要求下的改进效果更加显著。

Jul, 2023

DETR 不需要多尺度或局部设计

本论文介绍了一种改进的 DETR 检测器，它采用了 “简洁” 的设计，使用单尺度特征图和全局交叉注意力计算，并没有特定的局部约束，与之前基于 DETR 的主要检测器相比，没有重新引入多尺度和局部性的架构偏好。我们展示了两种简单的技术在简洁设计中的出人意料的有效性，以弥补多尺度特征图和局部性约束缺失的问题。第一种是将盒子到像素相对位置偏差（BoxRPB）项添加到交叉注意力公式中，它很好地指导每个查询与对应的对象区域相互关注，并提供了编码灵活性。第二种是基于遮蔽图像模型（MIM）的骨干预训练，有助于学习具有细粒度定位能力的表示，并且对于补救对多尺度特征图的依赖是至关重要的。通过结合这些技术和最新的训练方法和问题形成策略，改进的 “简洁” DETR 检测器在原始 DETR 检测器的基础上取得了显著的改进。通过利用 Object365 数据集进行预训练，使用 Swin-L 骨干网络达到了 63.9 的平均精度（mAP），与依赖于多尺度特征图和基于区域的特征提取的最先进的检测器性能相媲美。代码在此 https URL 中提供。

Aug, 2023

增强 DETR 收敛和多尺度特征融合的语义对齐匹配

本文提出 Semantic-Aligned-Matching DETR++（SAM-DETR++）算法，通过在同一特征嵌入空间中投影对象查询和编码图像特征以便更容易地匹配具有类似语义的对象。此算法有效地融合了多尺度特征，加速了 DETR 的收敛速度并提高了检测精度，拥有成为现有 DETR 收敛解决方案完美补充的潜力。

Jul, 2022

解耦的 DETR：空间分离定位和分类以改善端到端对象检测

通过空间解耦 DETR（SD-DETR）设计方案和任务感知查询生成模块，以及通过引入对齐损失的新颖设计，我们在 MSCOCO 数据集上展示了在目标检测任务中 DETR 性能的显著提升，例如我们将 Conditional DETR 的性能提高了 4.5 AP。

Oct, 2023

使用 Transformer 进行端到端的目标检测

该研究提出了一种新方法，将目标检测作为直接集合预测问题进行处理，主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型，能够高效地完成目标检测和全景分割任务，相较于许多现代检测器，DETR 模型概念简单且不需要专门的库。

May, 2020

Semi-DETR: 基于检测 Transformer 的半监督目标检测

我们提出了 Semi-DETR，一个基于 transformer 的端到端半监督物体检测器，通过阶段混合匹配策略、跨视图查询一致性方法和基于代价的伪标签挖掘模块解决 DETR 中存在的问题，并在 COCO 和 Pascal VOC 基准数据集上的所有 SSOD 设置中进行的实验表明，我们的方法优于所有现有方法。

Jul, 2023

混合匹配的 DETRs

本文提出一种名为 H-DETR 的简单而有效的混合匹配方案，该方案结合了原始的 “一对一” 匹配分支和辅助的 “一对多” 匹配分支，在训练期间显著提高了准确性，同时保持了 DETR 的端到端特性和相同的推理效率。

Jul, 2022

用 Transformer 进行的多目标追踪的对比学习

通过引入实例级对比损失、修订的采样策略和轻量级分配方法，我们展示了如何将 DETR 转化为 MOT 模型，学习目标的外观并保留检测能力，其性能在具有挑战性的 BDD100K 数据集上超过了先前的最新技术水平 2.6 mMOTA，并在 MOT17 数据集上与现有的基于 transformer 的方法相媲美。

Nov, 2023