TrackSSM: 基于状态空间模型的一般运动预测器
本文介绍了一种有效的框架以及注释轨迹的方法,用于生成具有前所未有的规模的MOT数据集,并通过验证表明我们的方法比现有技术更加准确和高效。此外,我们还 crowdsourcing 了PathTrack数据集,这个大规模的数据集将对物体追踪及目标识别领域产生重要影响,证明了这个数据集的价值,并且用已有的数据训练之后另行测评的结果证明了我们的方法的有效性。
Mar, 2017
本文提出了多目标预测问题(MOF),介绍了一种从物体角度而非鸟瞰角度处理的方法,使用了Citywalks数据集,并提出了一种新的编码器-解码器体系结构STED以预测边界框,相比已有的模型表现更出色。
Sep, 2019
TrackFormer是基于编码器-解码器变压器架构的端到端可训练的多目标追踪方法,利用注意力实现帧到帧的数据关联,以查询的形式自回归地跟踪现有轨迹并初始化新轨迹,能够实现目前最先进的多目标跟踪的性能。
Jan, 2021
本文提出了一种名为MotionTrack的新型可学习动作预测器,其综合结合了两个层级的运动特征以增强时态动态的建模和促进个体物体准确的未来运动预测。
Jun, 2023
使用自我监督训练改进现有的有监督模型,通过将数据标记和训练分为两个不同的阶段,并结合简单的技术来稠密化和重平衡伪标签,从而在实际视频中实现可靠的增益,适用于短期(基于流)和长距离(多帧)像素跟踪。
Jan, 2024
通过引入适应性的运动预测器,即AM-SORT,将卡尔曼滤波器替换为转换器架构,我们提出了一种基于运动的多目标跟踪方法,从而解决了在涉及非线性运动和遮挡情景时估计未来物体位置的限制。AM-SORT通过历史轨迹嵌入到转换器中,提取一系列边界框的时空特征,实现了与DanceTrack上最先进的跟踪器相当的性能,达到了56.3的IDF1和55.6的HOTA。我们进行了大量实验证明了我们的方法在预测遮挡下的非线性运动方面的有效性。
Jan, 2024
提出了一种基于运动的多目标跟踪方法,称为ETTrack,它融合了变换器模型和时间卷积网络,利用历史运动信息预测个体物体的未来运动,并通过新颖的动量修正损失函数提高了预测准确性,实验证明ETTrack在DanceTrack和SportsMOT上取得了与最先进跟踪器竞争性的性能,分别达到56.4%和74.4%的HOTA指标。
May, 2024
在计算机视觉中,多目标跟踪仍然是一个重大挑战,需要对视频序列中的多个对象进行精确定位和连续跟踪。本文提出了一种基于稀疏存储的新型记忆方法,通过选择性地存储基于对象运动和重叠意识的关键特征,旨在提高效率同时减少冗余。该方法在DanceTrack测试集中相对于MOTRv2取得了显著的改进,HOTA指标增加了1.1%,IDF1得分增加了2.1%。
Jul, 2024
本研究针对传统多目标跟踪方法在面对非线性和多样化运动时的不足,提出了一种新颖的基于Mamba的运动预测模型(MTP)。MTP通过数据驱动的方法捕捉复杂的运动模式,并有效补偿由于遮挡或运动模糊导致的观测缺失,从而提升了轨迹的连贯性与准确性。实验结果显示,MambaTrack在包括Dancetrack和SportsMOT在内的基准测试中表现优越。
Aug, 2024
本文提出了一种新颖的多目标跟踪算法IMM联合单应性状态估计(IMM-JHSE),解决了以往方法中相机运动补偿对轨迹位置状态预测的显著影响。通过结合静态与动态相机运动模型,并利用动态过程与测量噪声估计技术,实现了在多个数据集上的显著性能提升,尤其是HOTA指标分别提高了2.64和2.11。
Sep, 2024