TDT: 从未标注的视频中教授检测器跟踪技能
本文提出了一个允许在共享模型中学习目标检测和外观嵌入的 MOT 系统,并进一步提出了一个简单快速的联合方法。这两个组件的计算成本与以前的 MOT 系统相比显着降低,为未来实时 MOT 算法设计提供了一个简洁快速的基准线。与分离检测和嵌入(SDE)学习相比,其跟踪准确性相当。
Sep, 2019
本文提出了一种名为 DEFT 的高效的联合检测和跟踪模型,它使用外观匹配网络和对象检测网络共同学习,并添加了 LSTM 来捕获运动约束,DEFT 在应用于更具挑战性的跟踪数据时具有更高的健壮性。
Feb, 2021
RetinaTrack 是一种用于自动驾驶的联合的、简单而高效的多目标跟踪和目标检测模型,相较于当前业界最先进的跟踪算法有更好的表现且需要更少的计算量。
Mar, 2020
本文提出一种动态自适应阈值策略,同时考虑伪标签的质量和数量,并提出一种模块计算单级检测器的伪标签回归不确定性,仅使用来自 COCO 的 10%标记数据,我们的方法在基于锚点和无锚点的检测器(RetinaNet 和 FCOS)上实现了 35.0%AP 和 32.9%。
Apr, 2022
本文介绍了一种利用标记图像数据和未标记视频序列学习实例跟踪网络的半监督框架,采用实例对比目标,利用学习的嵌入区分每个实例并在不同帧之间稳定地跟踪对象,并且将此模块集成到单阶段实例分割和姿态估计框架中,较之两阶段网络显著降低了跟踪的计算复杂度。无需任何视频标注努力,我们的方法可达到与大多数完全监督方法相当甚至更好的性能。
Apr, 2021
提出了一种称为 “Tracking-by-Animation” 的跟踪框架,通过利用可微分的神经模型对多个对象进行跟踪,并在重构帧中动画化这些对象,从而实现了无需标记数据的端到端 MOT 学习。同时进一步提出了优化数据关联的 “Reprioritized Attentive Tracking” 模型。
Sep, 2018
基于 CBNetV2 和 Swin-B 的检测模型以及 MoCo-v2 的自监督外观模型,我们探索了一种新的 SOTA 方向,通过去除运动信息和 IoU 映射,取得了在 CVPR2023 WAD 研讨会的 MOTS 轨迹上的第一名以及 MOT 轨迹上的第二名的简单有效方法。
Aug, 2023
本文提出了一种新型的多目标跟踪模型 TubeTK,通过引入 “bounding-tube” 指示对象在短视频剪辑中的时空位置来训练该模型,而无需进行复杂的两步式训练。该模型在多个 MOT 常用基准测试中表现优异,即使不使用预先准备的检测结果,也能达到同类方法的最高性能。
Jun, 2020
本文提出了一个灵活的框架 DetMatch,用于 2D 和 3D 模态的联合半监督学习,通过识别两个传感器检测到的对象,生成更干净、更健壮的伪标签,进一步利用 RGB 图像的更丰富的语义来矫正不正确的 3D 类别预测。该方法在 KITTI 和 Waymo 数据集上取得了比强大的半监督学习方法更好的效果。
Mar, 2022
在这篇文章中,我们针对当前最先进的目标检测器 Deformable DETR,提出了一种针对少批注学习设置的半监督方法,使用学生 - 教师架构,在避免依赖教师模型生成的伪标签的敏感后处理的同时进行学习。我们在半监督目标检测基准 COCO 和 Pascal VOC 上评估了我们的方法,并在标注稀缺的情况下优于先前的方法。我们相信我们的贡献为在此设置中使用类似的目标检测方法开辟了新的可能性。
Oct, 2023