高质量物体检测的 Rank-DETR
我们引入了 Cascade-DETR 用于高质量的通用目标检测,通过提出级联注意力层来共同解决对多样领域的泛化和定位准确性问题,通过限制关注先前的目标框预测来显式地将对象中心信息集成到检测解码器中。为了进一步提高准确性,我们重新审视了查询的评分,不依赖于分类分数,而是预测查询的预期 IoU,从而显著提高了置信度的校准性,最后,我们引入了一个包含来自多个领域的 10 个数据集的通用目标检测基准,UDB10,在 COCO 上也取得了最新的进展,Cascade-DETR 在 UDB10 的所有数据集上都对基于 DETR 的检测器有了显著的改进,有些甚至超过 10 个 mAP,严格质量要求下的改进效果更加显著。
Jul, 2023
本文提出了第一款实时端到端物体检测器 ——Real-Time DEtection TRansformer(RT-DETR),支持灵活调整推理速度且在速度和准确度上均优于同一规模的 YOLO 检测器以及 DINO-Deformable-DETR-R50 模型,采用了高效的混合编码器处理多尺度特征并提出 IoU 感知的查询选择。
Apr, 2023
本文提出基于 Transformer 的新方法 O²DETR,实现了复杂的有方向物体检测,无需旋转锚点,其性能表现明显优于 Faster R-CNN 和 RetinaNet。
Jun, 2021
该研究提出了一种新方法,将目标检测作为直接集合预测问题进行处理,主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型,能够高效地完成目标检测和全景分割任务,相较于许多现代检测器,DETR 模型概念简单且不需要专门的库。
May, 2020
基于 Transformer 的目标检测器 (DETR) 在机器视觉任务中表现出显著性能,但其在处理遮挡和对抗扰动等不同图像干扰方面存在问题。我们通过多种实验和将 DETR 与基于卷积神经网络 (CNN) 的检测器(如 YOLO 和 Faster-RCNN)进行基准测试来研究这个问题。我们发现 DETR 在处理遮挡图像的信息丢失干扰方面表现良好。然而,在涂有对抗标记的图像上,网络需要产生一组新的不必要的键、查询和值,导致网络方向错误。与图像损坏基准测试中 YOLOv5 相比,DETR 的性能也较差。此外,我们发现 DETR 在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡,因为主要查询接收大部分梯度流。
Oct, 2023
提出了一种改进的检测算法 Align-DETR,通过引入一个新的指标来解决 DETR 算法的 misalignment problem,该算法采用的 IA-BCE 损失函数可以有效训练定位精度与分类分数之间的关系,利用 prime sample weighting 机制抑制不重要样本的干扰,最终在 COCO 数据集上取得了 50.2% 的 AP 表现。
Apr, 2023
我们提出了 Semi-DETR,一个基于 transformer 的端到端半监督物体检测器,通过阶段混合匹配策略、跨视图查询一致性方法和基于代价的伪标签挖掘模块解决 DETR 中存在的问题,并在 COCO 和 Pascal VOC 基准数据集上的所有 SSOD 设置中进行的实验表明,我们的方法优于所有现有方法。
Jul, 2023
探讨 DETR 中跨不同解码器层次的匹配稳定性问题,提出使用位置度量监督正样本的分类得分和集成位置度量到 DETR 的分类损失和匹配代价中的两种方法,并在 COCO 检测基准测试中验证其有效性。
Apr, 2023
本研究探讨了使用 DEtection TRansformer(DETR)检测医学成像中可疑区域的可行性,研究表明这种方法能够与甚至优于当前方法进行匹配,且无需依赖锚点或手动启发式设计等方式来检测对象。
Jun, 2023
本文提出一种自适应查询生成方法(RAQG),通过设计排名预测和自适应选择方法,使得 DETRs 在不同拥挤场景中能够自适应生成查询,并在 Crowdhuman 数据集和 Citypersons 数据集上取得了有竞争力的结果,特别是在 Crowdhuman 数据集上达到了 39.4% 的最佳 MR。
Oct, 2023