LW-DETR：实时检测的一种用于替代 YOLO 的 Transformer

Jun, 2024

LW-DETR：实时检测的一种用于替代 YOLO 的 Transformer

LW-DETR: A Transformer Replacement to YOLO for Real-Time Detection

Qiang Chen, Xiangbo Su, Xinyu Zhang, Jian Wang, Jiahui Chen...

TL;DR本文介绍了一种轻量级检测变换器 (LW-DETR)，它在实时目标检测方面优于 YOLO，架构简单，由 ViT 编码器、投影器和浅层 DETR 解码器组成，结合训练有效技术和插入式窗口和全局注意力等最新技术，改进了 ViT 编码器的复杂性，实验证明所提出的方法在 COCO 和其他基准数据集上优于现有的实时检测器。

Abstract

In this paper, we present a light-weight detection transformer, LW-DETR, which outperforms YOLOs for real-time object detection. The architecture is a simple stack of a →

light-weight detection transformer real-time object detection vit encoder shallow detr decoder interleaved window and global attentions

发现论文，激发创造

DETR 在实时目标检测中击败了 YOLO

本文提出了第一款实时端到端物体检测器 ——Real-Time DEtection TRansformer（RT-DETR），支持灵活调整推理速度且在速度和准确度上均优于同一规模的 YOLO 检测器以及 DINO-Deformable-DETR-R50 模型，采用了高效的混合编码器处理多尺度特征并提出 IoU 感知的查询选择。

Apr, 2023

DEYOv3：实时目标检测中的 DETR 和 YOLO

提出了一种名为 DEYOv3 的全新端到端实时目标检测模型，采用逐步训练方法，设计灵活、训练成本低，速度和准确性均优于现有的实时目标检测器。

Sep, 2023

探索 Difficult Images 对检测变换器（DETR）的鲁棒性和特性

基于 Transformer 的目标检测器 (DETR) 在机器视觉任务中表现出显著性能，但其在处理遮挡和对抗扰动等不同图像干扰方面存在问题。我们通过多种实验和将 DETR 与基于卷积神经网络 (CNN) 的检测器（如 YOLO 和 Faster-RCNN）进行基准测试来研究这个问题。我们发现 DETR 在处理遮挡图像的信息丢失干扰方面表现良好。然而，在涂有对抗标记的图像上，网络需要产生一组新的不必要的键、查询和值，导致网络方向错误。与图像损坏基准测试中 YOLOv5 相比，DETR 的性能也较差。此外，我们发现 DETR 在进行预测时严重依赖于主要查询，导致查询之间的贡献不平衡，因为主要查询接收大部分梯度流。

Oct, 2023

DEYO：用 YOLO 实现的端到端物体检测的 DETR

通过逐步训练方法，我们介绍了第一个实时端到端的目标检测模型 DEYO，它利用了纯卷积结构编码器，并且在速度和准确性上超过了现有的实时目标检测器。此外，通过仅使用单个 8GB RTX 4060 GPU，DEYO 系列可以在 COCO 数据集上完成第二阶段的训练，从而显著降低了训练成本。

Feb, 2024

Lite DETR：高效的交错多尺度编码器

本文提出了 Lite DETR，一种简单而高效的端到端目标检测框架，用于减少检测头的 GFLOPs，同时保持 99％的原始性能。通过设计一种有效的编码器块，以交错的方式更新高级和低级功能，并开发了一种关键感知可变形关注机制，以更好地融合跨尺度特征。全面的实验验证了所提出的 Lite DETR 的有效性和效率，而高效的编码器策略可以很好地推广到现有的 DETR-based 模型中。

Mar, 2023

使用 Transformer 进行端到端的目标检测

该研究提出了一种新方法，将目标检测作为直接集合预测问题进行处理，主要采用基于集合的全局损失和 Transformer 编码器 - 解码器架构构建 DETR 模型，能够高效地完成目标检测和全景分割任务，相较于许多现代检测器，DETR 模型概念简单且不需要专门的库。

May, 2020

Deformable DETR：可变形 Transformer 完整目标检测

Deformable DETR 提出了一种改进的 Transformer 注意力模块，只关注于围绕参考点的一小集采样点，能够更好地实现物体检测，尤其是在小物体上，并在 COCO 基准测试上得到了有效的实验结果。

Oct, 2020

奥地利自动驾驶中基于 YOLO 和 DETR 的深度学习视觉模型初步定性观察

这项研究探讨了单阶段和两阶段的 2D 目标检测算法，例如 You Only Look Once (YOLO) 和 Real-Time DEtection TRansformer (RT-DETR) 算法在奥地利道路的自动化目标检测中的应用，以提高道路安全性。该研究利用奥地利道路上的图像和视频构建了选择性数据集，涵盖了城市、农村和高山环境，并针对奥地利道路的独特挑战进行了定制化的目标检测方法。

Dec, 2023

基于 Transformer 的目标检测

本文提出基于 Transformer 的新方法 O²DETR，实现了复杂的有方向物体检测，无需旋转锚点，其性能表现明显优于 Faster R-CNN 和 RetinaNet。

Jun, 2021

通过信息增强和自适应特征融合的方式，在 DETR 中进行小物体检测

本研究针对小物体检测中 RT-DETR 模型的准确性不足提出了两个关键改进：首先，引入细粒度路径增强方法以提供更多详细信息来精确定位小物体；其次，采用自适应特征融合算法来有效整合不同尺度的特征信息，从而提高模型对不同尺度目标的检测准确率。

Jan, 2024