TDT: 从未标注的视频中教授检测器跟踪技能

CVPRMay, 2022

TDT: 从未标注的视频中教授检测器跟踪技能

TDT: Teaching Detectors to Track without Fully Annotated Videos

Shuzhi Yu, Guanhang Wu, Chunhui Gu, Mohammed E. Fathy

TL;DR本文提出了一种基于数据蒸馏的跟踪器，通过使用训练于 Re-ID 数据集的嵌入网络生成伪标签来增强检测数据集，从而同时实现了快速和高质量的多目标跟踪。

Abstract

Recently, one-stage trackers that use a joint model to predict both detections and appearance embeddings in one forward pass received much attention and achieved state-of-the-art results on the multi-object tracking

one-stage trackers multi-object tracking two-stage approach data distillation teacher embedder

发现论文，激发创造

实时多目标跟踪

本文提出了一个允许在共享模型中学习目标检测和外观嵌入的 MOT 系统，并进一步提出了一个简单快速的联合方法。这两个组件的计算成本与以前的 MOT 系统相比显着降低，为未来实时 MOT 算法设计提供了一个简洁快速的基准线。与分离检测和嵌入（SDE）学习相比，其跟踪准确性相当。

Sep, 2019

DEFT: 检测嵌入用于跟踪

本文提出了一种名为 DEFT 的高效的联合检测和跟踪模型，它使用外观匹配网络和对象检测网络共同学习，并添加了 LSTM 来捕获运动约束，DEFT 在应用于更具挑战性的跟踪数据时具有更高的健壮性。

Feb, 2021

RetinaTrack：基于单阶段的联合检测与跟踪算法

RetinaTrack 是一种用于自动驾驶的联合的、简单而高效的多目标跟踪和目标检测模型，相较于当前业界最先进的跟踪算法有更好的表现且需要更少的计算量。

Mar, 2020

S4OD: 单阶段目标检测的半监督学习

本文提出一种动态自适应阈值策略，同时考虑伪标签的质量和数量，并提出一种模块计算单级检测器的伪标签回归不确定性，仅使用来自 COCO 的 10％标记数据，我们的方法在基于锚点和无锚点的检测器（RetinaNet 和 FCOS）上实现了 35.0％AP 和 32.9％。

Apr, 2022

无需视频注释学习实例跟踪

本文介绍了一种利用标记图像数据和未标记视频序列学习实例跟踪网络的半监督框架，采用实例对比目标，利用学习的嵌入区分每个实例并在不同帧之间稳定地跟踪对象，并且将此模块集成到单阶段实例分割和姿态估计框架中，较之两阶段网络显著降低了跟踪的计算复杂度。无需任何视频标注努力，我们的方法可达到与大多数完全监督方法相当甚至更好的性能。

Apr, 2021

通过动画跟踪：多物体注视跟踪的无监督学习

提出了一种称为 “Tracking-by-Animation” 的跟踪框架，通过利用可微分的神经模型对多个对象进行跟踪，并在重构帧中动画化这些对象，从而实现了无需标记数据的端到端 MOT 学习。同时进一步提出了优化数据关联的 “Reprioritized Attentive Tracking” 模型。

Sep, 2018

ReIDTrack：无运动的多对象追踪与分割

基于 CBNetV2 和 Swin-B 的检测模型以及 MoCo-v2 的自监督外观模型，我们探索了一种新的 SOTA 方向，通过去除运动信息和 IoU 映射，取得了在 CVPR2023 WAD 研讨会的 MOTS 轨迹上的第一名以及 MOT 轨迹上的第二名的简单有效方法。

Aug, 2023

TubeTK：一步训练模型中采用管道跟踪多对象

本文提出了一种新型的多目标跟踪模型 TubeTK，通过引入 “bounding-tube” 指示对象在短视频剪辑中的时空位置来训练该模型，而无需进行复杂的两步式训练。该模型在多个 MOT 常用基准测试中表现优异，即使不使用预先准备的检测结果，也能达到同类方法的最高性能。

Jun, 2020

DetMatch：联合二维与三维半监督目标检测中两位教师优于一位

本文提出了一个灵活的框架 DetMatch，用于 2D 和 3D 模态的联合半监督学习，通过识别两个传感器检测到的对象，生成更干净、更健壮的伪标签，进一步利用 RGB 图像的更丰富的语义来矫正不正确的 3D 类别预测。该方法在 KITTI 和 Waymo 数据集上取得了比强大的半监督学习方法更好的效果。

Mar, 2022

目标检测的少标注学习：基于 Transformer 模型是否更高效？

在这篇文章中，我们针对当前最先进的目标检测器 Deformable DETR，提出了一种针对少批注学习设置的半监督方法，使用学生 - 教师架构，在避免依赖教师模型生成的伪标签的敏感后处理的同时进行学习。我们在半监督目标检测基准 COCO 和 Pascal VOC 上评估了我们的方法，并在标注稀缺的情况下优于先前的方法。我们相信我们的贡献为在此设置中使用类似的目标检测方法开辟了新的可能性。

Oct, 2023