该研究提出了 TrackingNet 数据集,为在野外进行物体跟踪提供了第一个大规模数据集和基准,并评估了 20 多个追踪器模型,结果表明,在野外物体跟踪仍然远未解决。
Mar, 2018
提出了一种名为 Track Long and Prosper(TLP)的新型长视频数据集和单个目标跟踪基准,包含 50 个高清视频,超过 400 分钟(676K 帧),是现有通用数据集平均持续时间的 20 倍以上,通过对 17 种现有跟踪器进行精度和运行时间速度排名,以及定性和定量评估,突出了跟踪性能的长期方面的重要性并指出了研究努力在长期跟踪方向的潜在需求。
Dec, 2017
该研究介绍了一个多样化的跟踪数据集,采用自下而上的方法获取了一个比以前跟踪基准的种类翻了一个数量级的大词汇,并进行评估表明现有的多种对象跟踪器在野外场景中存在困难,而基于检测的多对象跟踪器实际上是有竞争力的。
May, 2020
LaSOT 是一个高质量的大规模单目标跟踪基准,拥有 85 个类别,共计超过 387 万帧,每帧都经过精心手动注释,提供了一个专门的高质量平台供跟踪器的训练和评估。在 LaSOT 上的广泛评估表明,仍然存在显着的改进空间。
Sep, 2020
本文提出了一种利用普通物体跟踪器在大规模未标记的汽车环境视频中进行物体挖掘的方法,并展示了超过 36 万个自动挖掘的物体轨迹,并提出了一种自动发现新类别和学习检测器的方法。此外,我们还展示了利用挖掘轨迹进行目标检测器适应的初步结果。
Sep, 2018
本文对深度学习手段在视觉目标跟踪中的应用作了全面综述,包括常用的数据集、评估指标以及当前领先的跟踪器,并对它们进行了量化和定性分析,旨在为实践者在选择方案时提供指导和对未来方向进行探讨。
Dec, 2019
本研究解决了传统多目标跟踪方法只针对少数预定义对象类型的固有限制,并提出了一种新的任务 Open-vocabulary MOT,进一步开发出一种数据效率优异的开放词汇跟踪器 OVTrack,通过知识蒸馏和数据幻觉策略有效提升图像分类和关联准确性,最终在大规模的 TAO 基准测试上取得了最新的最优效果。
Apr, 2023
我们在 V3Det 数据集上对监督式大规模词汇视觉检测任务进行了研究,通过调整网络结构、改变损失函数和设计训练策略等一系列改进,我们的模型在 V3Det Challenge 2024 的大规模目标检测 (Supervised) 任务和 Open Vocabulary Object Detection (OVD) 任务中取得了出色的排名。
Jun, 2024
本文提出了 LaSOT,一个用于对象跟踪的高质量基准数据集,它包括大量具有视觉挑战的序列,同时还提供了自然语言方面的数据丰富,以促进自然语言特征的研究。35 种跟踪算法在该数据集上进行了实验,并发现仍有很大的改善空间。
该论文提出了一个新的学习框架,结合 LVIS 和 TAO 数据集,解决了监督不足的问题,从而实现在视频识别中的检测和追踪,进而在 TAO 基准之上,提升了大型目标追踪器的表现。
Dec, 2022