CaTDet: 用于视频中高效目标检测的级联跟踪检测器

Sep, 2018

CaTDet: 用于视频中高效目标检测的级联跟踪检测器

CaTDet: Cascaded Tracked Detector for Efficient Object Detection from Video

Huizi Mao, Taeyoung Kong, William J. Dally

TL;DR本文提出了一种名为 CaTDet 的系统，它通过利用视频中的时间相关性加快物体检测的速度。该系统由两个 DNN 模型和一个额外的跟踪器组成，用于预测历史检测的感兴趣区域，并使用设计用于延迟关键视频应用的新度量 mean Delay（mD）。实验结果表明，在 KITTI 数据集上，CaTDet 将操作次数降低了 5.1-8.7 倍，并具有与单模型 Faster R-CNN 检测器相同的平均精度（mAP），而额外的延迟仅为 0.3 帧。在 CityPersons 数据集上，CaTDet 减少了 13.0 倍的操作，并损失 0.8％的 mAP。

Abstract

Detecting objects in a video is a compute-intensive task. In this paper we propose catdet, a system to speedup object detection by leverag

catdet object detection video dnn models latency-critical applications

发现论文，激发创造

ApproxDet: 面向手机的内容和争议感知的近似目标检测

本文提出一种自适应移动设备视频目标检测框架 ApproxDet，采用多分支目标检测内核，并引入数据驱动建模方法和时延 SLA 驱动调度器，在运行时选择最佳执行分支以适应内容和资源争用特征，并结合可近似视频目标跟踪算法创建端到端视频目标检测系统。在使用一组大型基准视频数据集的评估中，与 AdaScale 和 YOLOv3 进行量化比较，结果表明 ApproxDet 适应了各种争用和内容特征，并优于所有基线，例如，相对于 YOLOv3，它实现了 52% 的较低时延和 11.1% 的更高准确度。

Oct, 2020

级联 DETR：深入高质量的通用目标检测

我们引入了 Cascade-DETR 用于高质量的通用目标检测，通过提出级联注意力层来共同解决对多样领域的泛化和定位准确性问题，通过限制关注先前的目标框预测来显式地将对象中心信息集成到检测解码器中。为了进一步提高准确性，我们重新审视了查询的评分，不依赖于分类分数，而是预测查询的预期 IoU，从而显著提高了置信度的校准性，最后，我们引入了一个包含来自多个领域的 10 个数据集的通用目标检测基准，UDB10，在 COCO 上也取得了最新的进展，Cascade-DETR 在 UDB10 的所有数据集上都对基于 DETR 的检测器有了显著的改进，有些甚至超过 10 个 mAP，严格质量要求下的改进效果更加显著。

Jul, 2023

空间 - 时间增强变压器：用于多帧三维目标检测

STEMD 是一种基于 DETR 的新型端到端框架，用于实现多帧 3D 物体检测，其有效地捕获了特征和相应级别的时空依赖性，并引入了空间 - 时间图注意力网络，以解决对象之间的空间交互作用和复杂的时间依赖性问题，控制冗余检测结果。

Jul, 2023

通过尺度 - 时间网格优化视频目标检测

本文探讨了一种基于时间空间计算的高效物体检测方法，通过在规模，时间和空间上重新配置计算来实现性能和计算成本的平衡，提出了一个统一的框架，在 ImageNet VID 数据集中实现了具有竞争力的 mAP 79.6％。

Apr, 2018

上下文增强的单图像目标检测转换器

我们提出了一种新颖的单图像目标检测方法，称为 Context Enhanced TRansformer (CETR)，通过将时间上下文引入 DETR 并使用新设计的内存模块。

Dec, 2023

TriDet: 基于相对边界建模的时间动作检测

本文提出了一种一阶段框架 TriDet，用于时间动作检测，其结合了 Trident-head 和 SGP-based 特征金字塔的快速、高效特性，取得了在三个基准测试中的最优性能，表现出优异的时间动作检测结果。

Mar, 2023

TransVOD: 基于空间 - 时间变换器的端到端视频目标检测

本文提出了一种基于 Transformer 和 DETR 的视频目标检测系统 TransVOD，通过时间 Transformer 和 Temporal Deformable Transformer Decoder 的设计，能够提高复杂的手工设计检测器的性能，同时在 ImageNet VID 数据集上获得了新的最佳结果。

Jan, 2022

BEVDet4D: 多相机 3D 物体检测中的时序线索利用

提出一种名为 BEVDet4D 的新型监测方法，将视觉单帧数据提升至时空 4D 空间，通过对前一帧和当前帧候选特征的对比，使 BEVDet4D 能够访问时间线索，已达到与雷达检测方法相媲美的检测表现

Mar, 2022

UA-DETRAC: 多目标检测和跟踪的新基准和协议

本研究基于 UA-DETRAC 数据集，对多目标跟踪系统中目标检测精度对总体性能的影响进行了全面的量化研究，提出了新的综合分析工具和指标

Nov, 2015

TinyDet：在轻量级通用检测器中实现精确的小物体检测

TinyDet 是一个计算量极低的轻量级检测框架，采用高分辨率特征图、稀疏连接卷积、强化骨干网络等策略，解决小目标检测困难的问题，并在 COCO 基准测试中实现 30.3 AP 和 13.5 AP^s 的优异性能。

Apr, 2023