本文提出一种半监督的方法,用于在长视频中定位多个未知的物体实例,通过这种方法可以有效地进行对象检测和跟踪,同时实现对大量静态物体实例的识别。
May, 2015
该论文提出了一种新的框架,通过捕捉时间空间和鼓励预测一致性来提高视频中的目标检测表现,并融合了强、弱监督的训练方式和平滑性惩罚,提高了 Youtube-Video Objects 数据集上的平均精度(mAP)。
Jul, 2016
介绍了 OxUvA 数据集和基准,该数据集用于评估单目标跟踪算法,并对算法在具有平均长度大于两分钟且具有频繁目标对象消失的大规模序列中的定位和检测能力进行了评估。
Mar, 2018
该研究提出了TrackingNet数据集,为在野外进行物体跟踪提供了第一个大规模数据集和基准,并评估了20多个追踪器模型,结果表明,在野外物体跟踪仍然远未解决。
该研究介绍了一个多样化的跟踪数据集,采用自下而上的方法获取了一个比以前跟踪基准的种类翻了一个数量级的大词汇,并进行评估表明现有的多种对象跟踪器在野外场景中存在困难,而基于检测的多对象跟踪器实际上是有竞争力的。
May, 2020
本文介绍了一种对长尾目标跟踪性能进行提升的方法,该方法通过聚合跟踪数据中多种视角提供的信息来改进分类器的准确性,进而处理视频场景中的不一致分类结果,同时提供数据增强工具来优化视频中稀疏注释的效率,该方法是可插拔的,并可以简单地添加到现有的物体跟踪器中,达到了新的最先进的结果。
Jun, 2022
本研究解决了传统多目标跟踪方法只针对少数预定义对象类型的固有限制,并提出了一种新的任务Open-vocabulary MOT,进一步开发出一种数据效率优异的开放词汇跟踪器OVTrack,通过知识蒸馏和数据幻觉策略有效提升图像分类和关联准确性,最终在大规模的TAO基准测试上取得了最新的最优效果。
Apr, 2023
基于检测导向的图像-文本预训练的新的开放词汇检测方法用于填补图像级预训练和开放词汇对象检测之间的差距,通过使探测器头从嘈杂的图像-文本对中学习,我们的方法能够利用对比损失学习到新出现的对象-语义线索,在LVIS和COCO基准测试中均获得了非常有竞争力的结果,并在转移检测设置中显著优于基线。
Sep, 2023
本研究解决了开放词汇多目标跟踪(OVMOT)中的检测与跟踪不同类别物体的挑战。提出的VOVTrack方法通过整合与多目标跟踪相关的对象状态和视频中心训练,创新性地改进了目标定位和分类。实验结果表明,VOVTrack在开放词汇跟踪任务中优于现有方法,成为该领域的最先进解决方案。
Oct, 2024
本研究针对开放词汇多目标跟踪(OVT)领域的基准缺乏问题,提出了一个新的大规模基准OVT-B,包含1,048类对象和1,973个视频,极大丰富了该领域的数据资源。此外,研究还开发了一种简单而有效的基线方法,通过整合运动特征来进行目标跟踪,实验证明了该方法的有效性和基准的实用性。