通过逐步训练方法,我们介绍了第一个实时端到端的目标检测模型 DEYO,它利用了纯卷积结构编码器,并且在速度和准确性上超过了现有的实时目标检测器。此外,通过仅使用单个 8GB RTX 4060 GPU,DEYO 系列可以在 COCO 数据集上完成第二阶段的训练,从而显著降低了训练成本。
Feb, 2024
提出了一种名为 DEYOv3 的全新端到端实时目标检测模型,采用逐步训练方法,设计灵活、训练成本低,速度和准确性均优于现有的实时目标检测器。
Sep, 2023
本文介绍了 DINO(带有改进去噪技术和锚框选择方法的 DETR 模型),是一种最先进的端到端对象检测器,通过使用对比方式的去噪训练、混合查询选择方法的锚初始化以及两次向前的方案了来改进 DETR 模型,该模型使用 ResNet-50 的主干和多尺度特征,在 COCO 数据集上的 12 个时期达到 49.4AP,69.3% val mAP (63.3AP & 63.2AP),并且可以很好地扩展到模型大小和数据集大小。
Mar, 2022
通过构建一个基于查询的以卷积网络为基础的端到端目标检测框架 DECO,本研究探索了是否能够用卷积网络来取代复杂的 Transformer 架构,该框架在复杂性较低的情况下实现了与传统的物体检测模型相媲美的性能,并带来了另一种设计目标检测框架的视角。
Dec, 2023
本文提出了第一款实时端到端物体检测器 ——Real-Time DEtection TRansformer(RT-DETR),支持灵活调整推理速度且在速度和准确度上均优于同一规模的 YOLO 检测器以及 DINO-Deformable-DETR-R50 模型,采用了高效的混合编码器处理多尺度特征并提出 IoU 感知的查询选择。
Apr, 2023
通过消除非极大值抑制(NMS)的依赖性和综合优化 YOLOs 的各个组件,本研究提出了一种新一代的实时端到端目标检测模型 YOLOv10,其在性能和效率方面均取得了最新的成果。
May, 2024
该论文提出了一种名为 YOLOF 的对象检测方法,通过只使用一个层级特征来解决优化问题,以达到和 FPN 相关模型相当的效果,但快 2.5 倍,并且可以在不使用 Transformer 层的情况下在单层特征下达到 DETR 的性能,训练时间只需要其 1/7,并且在 2080Ti 上可以达到 60fps。
Mar, 2021
YOGA 是一种基于深度学习的、针对低端边缘设备而设计的轻量级目标检测模型,采用两阶段特征学习管道和注意机制的多尺度特征融合,取得了更好的模型大小和准确性之间的平衡。在 COCO 数据集上的测试结果显示,YOGA 是适用于低端边缘设备实际部署的理想选择,其 AP 可以提高 22%,参数和 FLOPs 的数量可以减少 23-34%。
Jul, 2023
该论文提出了一种高效、资源利用率高的端到端多目标跟踪模型 MO-YOLO,通过结合 YOLO 和 RT-DETR 模型的优势,构建了一种高效、轻量级的多目标跟踪网络,为多目标跟踪领域提供了新的机会。
Oct, 2023
在本研究中,我们提出了一种先进的 Gatherand-Distribute 机制(GD 机制),该机制借助卷积和自注意操作实现。我们设计的新模型 Gold-YOLO 在跨所有模型尺度上提升了多尺度特征融合能力并在延迟和准确性之间实现了理想的平衡。此外,我们首次在 YOLO 系列中实现了 MAE 风格的预训练,使得 YOLO 系列模型能够从无监督预训练中受益。Gold-YOLO-N 在 COCO val2017 数据集上取得了出色的 39.9% AP 和在 T4 GPU 上的 1030 FPS,超过了以前的 SOTA 模型 YOLOv6-3.0-N 的相似 FPS +2.4%。