混合匹配的 DETRs

CVPRJul, 2022

DETRs with Hybrid Matching

Ding Jia, Yuhui Yuan, Haodi He, Xiaopei Wu, Haojun Yu...

TL;DR本文提出一种名为 H-DETR 的简单而有效的混合匹配方案，该方案结合了原始的 “一对一” 匹配分支和辅助的 “一对多” 匹配分支，在训练期间显著提高了准确性，同时保持了 DETR 的端到端特性和相同的推理效率。

Abstract

one-to-one set matching is a key design for detr to establish its end-to-end capability, so that object detection does not require a hand-

detr object detection one-to-one set matching hybrid matching scheme h-detr

发现论文，激发创造

MS-DETR: 使用混合监督实现高效的 DETR 训练

改进了 DETR 训练效率，通过使用混合的一对一和一对多监督来明确监督候选生成过程，而无需额外的解码器分支或对象查询。

Jan, 2024

Semi-DETR: 基于检测 Transformer 的半监督目标检测

我们提出了 Semi-DETR，一个基于 transformer 的端到端半监督物体检测器，通过阶段混合匹配策略、跨视图查询一致性方法和基于代价的伪标签挖掘模块解决 DETR 中存在的问题，并在 COCO 和 Pascal VOC 基准数据集上的所有 SSOD 设置中进行的实验表明，我们的方法优于所有现有方法。

Jul, 2023

具有稳定匹配的检测变压器

探讨 DETR 中跨不同解码器层次的匹配稳定性问题，提出使用位置度量监督正样本的分类得分和集成位置度量到 DETR 的分类损失和匹配代价中的两种方法，并在 COCO 检测基准测试中验证其有效性。

Apr, 2023

增强 DETR 收敛和多尺度特征融合的语义对齐匹配

本文提出 Semantic-Aligned-Matching DETR++（SAM-DETR++）算法，通过在同一特征嵌入空间中投影对象查询和编码图像特征以便更容易地匹配具有类似语义的对象。此算法有效地融合了多尺度特征，加速了 DETR 的收敛速度并提高了检测精度，拥有成为现有 DETR 收敛解决方案完美补充的潜力。

Jul, 2022

通过语义对齐匹配加速 DETR 收敛

SAM-DETR 通过解决不同特征嵌入空间中对象查询与目标特征匹配的复杂性问题，实现了语义对齐匹配，加速了收敛速度并提高了检测精度。

Mar, 2022

Align-DETR: 使用简单的 IoU 感知 BCE 损失来改进 DETR

提出了一种改进的检测算法 Align-DETR，通过引入一个新的指标来解决 DETR 算法的 misalignment problem，该算法采用的 IA-BCE 损失函数可以有效训练定位精度与分类分数之间的关系，利用 prime sample weighting 机制抑制不重要样本的干扰，最终在 COCO 数据集上取得了 50.2% 的 AP 表现。

Apr, 2023

使用 Transformer 进行端到端的目标检测

该研究提出了一种新方法，将目标检测作为直接集合预测问题进行处理，主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型，能够高效地完成目标检测和全景分割任务，相较于许多现代检测器，DETR 模型概念简单且不需要专门的库。

May, 2020

高质量物体检测的 Rank-DETR

引入一种基于等级的 DETR 目标检测器 Rank-DETR，通过一系列等级化设计，包括等级化架构设计和损失函数设计，提高了准确性和定位精度，并成功应用于最新的 SOTA 方法，展示了其有效性。

Oct, 2023

DETR 不需要多尺度或局部设计

本论文介绍了一种改进的 DETR 检测器，它采用了 “简洁” 的设计，使用单尺度特征图和全局交叉注意力计算，并没有特定的局部约束，与之前基于 DETR 的主要检测器相比，没有重新引入多尺度和局部性的架构偏好。我们展示了两种简单的技术在简洁设计中的出人意料的有效性，以弥补多尺度特征图和局部性约束缺失的问题。第一种是将盒子到像素相对位置偏差（BoxRPB）项添加到交叉注意力公式中，它很好地指导每个查询与对应的对象区域相互关注，并提供了编码灵活性。第二种是基于遮蔽图像模型（MIM）的骨干预训练，有助于学习具有细粒度定位能力的表示，并且对于补救对多尺度特征图的依赖是至关重要的。通过结合这些技术和最新的训练方法和问题形成策略，改进的 “简洁” DETR 检测器在原始 DETR 检测器的基础上取得了显著的改进。通过利用 Object365 数据集进行预训练，使用 Swin-L 骨干网络达到了 63.9 的平均精度（mAP），与依赖于多尺度特征图和基于区域的特征提取的最先进的检测器性能相媲美。代码在此 https URL 中提供。

Aug, 2023

用于通用多目标跟踪的孪生 DETR

本文针对 Generic MOT 提出了一种简单而有效的方法 Siamese-DETR，通过基于给定模板图像设计多尺度的对象查询，引入动态匹配训练策略，并通过在前一帧中添加跟踪框作为额外的查询框，简化了在线跟踪流程，将复杂的数据关联替换为更简单的非极大值抑制方法。广泛的实验证明，Siamese-DETR 在 GMOT-40 数据集上远远超过现有的 MOT 方法。

Oct, 2023