视觉跟踪的深度学习: 一项综述
本研究提出了一种利用单个卷积神经网络(CNN)实现在纯在线模式下学习目标对象有效特征表示的高效且非常强大的跟踪算法,其利用一种新颖的截断结构损失函数、稳健的样本选择机制和一种懒但有效的更新算法,使CNN在视觉跟踪中对遮挡或错误检测等难以处理的问题具有鲁棒性,在实验中,与现有跟踪器相比,该算法可以提高性能。
Feb, 2015
通过基于卷积神经网络的表示方式提出了新型的视觉跟踪算法,该算法使用大型跟踪数据集进行了CNN预训练,从而获得了通用物体表示信息,并通过领域特定的二分类器不断迭代训练来实现在线跟踪。实验结果表明,该算法在目前已有的跟踪基准数据集中性能表现卓越。
Oct, 2015
提出了一种名为Track Long and Prosper(TLP)的新型长视频数据集和单个目标跟踪基准,包含50个高清视频,超过400分钟(676K帧),是现有通用数据集平均持续时间的20倍以上,通过对17种现有跟踪器进行精度和运行时间速度排名,以及定性和定量评估,突出了跟踪性能的长期方面的重要性并指出了研究努力在长期跟踪方向的潜在需求。
Dec, 2017
介绍了 OxUvA 数据集和基准,该数据集用于评估单目标跟踪算法,并对算法在具有平均长度大于两分钟且具有频繁目标对象消失的大规模序列中的定位和检测能力进行了评估。
Mar, 2018
该研究提出了TrackingNet数据集,为在野外进行物体跟踪提供了第一个大规模数据集和基准,并评估了20多个追踪器模型,结果表明,在野外物体跟踪仍然远未解决。
Mar, 2018
提出了一种无监督学习方法,基于Siamese相关滤波网络,在前向追踪和反向追溯之间进行一致性测量来训练视觉跟踪器,并提出了多帧验证方案和一种成本敏感的损失来促进无监督学习,该方法在速度上达到实时水平,在不使用昂贵标记数据的情况下,实现与现有标准跟踪器相当的准确度,而且在使用更多未标记或弱标记数据的情况下,该方法有进一步提高跟踪精度的潜力。
Jul, 2020
该论文系统评估了90多个基于DCFs和深度Siamese Network的跟踪器在九个基准测试中的表现,讨论了这两种跟踪范例中相同和不同的挑战,并分析了它们的性能,最后给出了基于分析的挑战建议。
Dec, 2021
通过将光流算法与深度学习架构相结合,提出了一种混合策略来实现实时目标追踪,实现了在追踪精度和计算成本之间的理想平衡,相比其他最先进方法在 MOTA 上达到了 0.608 的结果,并且运行时间减少了一半,准确性基本相同。
Aug, 2023