LW-DETR:实时检测的一种用于替代 YOLO 的 Transformer
本文提出了第一款实时端到端物体检测器 ——Real-Time DEtection TRansformer(RT-DETR),支持灵活调整推理速度且在速度和准确度上均优于同一规模的 YOLO 检测器以及 DINO-Deformable-DETR-R50 模型,采用了高效的混合编码器处理多尺度特征并提出 IoU 感知的查询选择。
Apr, 2023
提出了一种名为 DEYOv3 的全新端到端实时目标检测模型,采用逐步训练方法,设计灵活、训练成本低,速度和准确性均优于现有的实时目标检测器。
Sep, 2023
基于 Transformer 的目标检测器 (DETR) 在机器视觉任务中表现出显著性能,但其在处理遮挡和对抗扰动等不同图像干扰方面存在问题。我们通过多种实验和将 DETR 与基于卷积神经网络 (CNN) 的检测器(如 YOLO 和 Faster-RCNN)进行基准测试来研究这个问题。我们发现 DETR 在处理遮挡图像的信息丢失干扰方面表现良好。然而,在涂有对抗标记的图像上,网络需要产生一组新的不必要的键、查询和值,导致网络方向错误。与图像损坏基准测试中 YOLOv5 相比,DETR 的性能也较差。此外,我们发现 DETR 在进行预测时严重依赖于主要查询,导致查询之间的贡献不平衡,因为主要查询接收大部分梯度流。
Oct, 2023
通过逐步训练方法,我们介绍了第一个实时端到端的目标检测模型 DEYO,它利用了纯卷积结构编码器,并且在速度和准确性上超过了现有的实时目标检测器。此外,通过仅使用单个 8GB RTX 4060 GPU,DEYO 系列可以在 COCO 数据集上完成第二阶段的训练,从而显著降低了训练成本。
Feb, 2024
本文提出了 Lite DETR,一种简单而高效的端到端目标检测框架,用于减少检测头的 GFLOPs,同时保持 99%的原始性能。通过设计一种有效的编码器块,以交错的方式更新高级和低级功能,并开发了一种关键感知可变形关注机制,以更好地融合跨尺度特征。全面的实验验证了所提出的 Lite DETR 的有效性和效率,而高效的编码器策略可以很好地推广到现有的 DETR-based 模型中。
Mar, 2023
该研究提出了一种新方法,将目标检测作为直接集合预测问题进行处理,主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型,能够高效地完成目标检测和全景分割任务,相较于许多现代检测器,DETR 模型概念简单且不需要专门的库。
May, 2020
Deformable DETR 提出了一种改进的 Transformer 注意力模块,只关注于围绕参考点的一小集采样点,能够更好地实现物体检测,尤其是在小物体上,并在 COCO 基准测试上得到了有效的实验结果。
Oct, 2020
这项研究探讨了单阶段和两阶段的 2D 目标检测算法,例如 You Only Look Once (YOLO) 和 Real-Time DEtection TRansformer (RT-DETR) 算法在奥地利道路的自动化目标检测中的应用,以提高道路安全性。该研究利用奥地利道路上的图像和视频构建了选择性数据集,涵盖了城市、农村和高山环境,并针对奥地利道路的独特挑战进行了定制化的目标检测方法。
Dec, 2023
本文提出基于 Transformer 的新方法 O²DETR,实现了复杂的有方向物体检测,无需旋转锚点,其性能表现明显优于 Faster R-CNN 和 RetinaNet。
Jun, 2021
本研究针对小物体检测中 RT-DETR 模型的准确性不足提出了两个关键改进:首先,引入细粒度路径增强方法以提供更多详细信息来精确定位小物体;其次,采用自适应特征融合算法来有效整合不同尺度的特征信息,从而提高模型对不同尺度目标的检测准确率。
Jan, 2024