DEYOv3:实时目标检测中的 DETR 和 YOLO
通过逐步训练方法,我们介绍了第一个实时端到端的目标检测模型 DEYO,它利用了纯卷积结构编码器,并且在速度和准确性上超过了现有的实时目标检测器。此外,通过仅使用单个 8GB RTX 4060 GPU,DEYO 系列可以在 COCO 数据集上完成第二阶段的训练,从而显著降低了训练成本。
Feb, 2024
本文提出了第一款实时端到端物体检测器 ——Real-Time DEtection TRansformer(RT-DETR),支持灵活调整推理速度且在速度和准确度上均优于同一规模的 YOLO 检测器以及 DINO-Deformable-DETR-R50 模型,采用了高效的混合编码器处理多尺度特征并提出 IoU 感知的查询选择。
Apr, 2023
本文介绍了一种轻量级检测变换器 (LW-DETR),它在实时目标检测方面优于 YOLO,架构简单,由 ViT 编码器、投影器和浅层 DETR 解码器组成,结合训练有效技术和插入式窗口和全局注意力等最新技术,改进了 ViT 编码器的复杂性,实验证明所提出的方法在 COCO 和其他基准数据集上优于现有的实时检测器。
Jun, 2024
通过消除非极大值抑制(NMS)的依赖性和综合优化 YOLOs 的各个组件,本研究提出了一种新一代的实时端到端目标检测模型 YOLOv10,其在性能和效率方面均取得了最新的成果。
May, 2024
该论文提出了一种高效、资源利用率高的端到端多目标跟踪模型 MO-YOLO,通过结合 YOLO 和 RT-DETR 模型的优势,构建了一种高效、轻量级的多目标跟踪网络,为多目标跟踪领域提供了新的机会。
Oct, 2023
本文提出了一种名为 DEYOv2 的新型物体检测器,它利用渐进式推理方法加速模型训练并提高性能,采用一对多匹配和端到端优化的方式,结合经典检测器和查询型检测器的优点,在同等设置下超过了所有现有的基于查询的端到端检测器。
Jun, 2023
该研究提出了一种新方法,将目标检测作为直接集合预测问题进行处理,主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型,能够高效地完成目标检测和全景分割任务,相较于许多现代检测器,DETR 模型概念简单且不需要专门的库。
May, 2020
通过构建一个基于查询的以卷积网络为基础的端到端目标检测框架 DECO,本研究探索了是否能够用卷积网络来取代复杂的 Transformer 架构,该框架在复杂性较低的情况下实现了与传统的物体检测模型相媲美的性能,并带来了另一种设计目标检测框架的视角。
Dec, 2023
这项研究探讨了单阶段和两阶段的 2D 目标检测算法,例如 You Only Look Once (YOLO) 和 Real-Time DEtection TRansformer (RT-DETR) 算法在奥地利道路的自动化目标检测中的应用,以提高道路安全性。该研究利用奥地利道路上的图像和视频构建了选择性数据集,涵盖了城市、农村和高山环境,并针对奥地利道路的独特挑战进行了定制化的目标检测方法。
Dec, 2023