全面跟踪物体表征
我们提出了一种新的多对象跟踪的视觉分层表示范式,并通过关注对象的组合性视觉区域和与背景的对比背景信息,不仅仅局限于语义可视线索(如边界框),而是更有效地区分对象。这种组合性 - 语义 - 上下文层次结构灵活地集成到不同的基于外观的多对象跟踪方法中。我们还提出了一种基于注意力的视觉特征模块来融合分层视觉表示。该方法在多个多对象跟踪基准中实现了最先进的准确性和时间效率。
Feb, 2024
提出了一种鲁棒的目标建模框架(ROMTrack),同时对固有模板和混合模板特征进行建模,通过结合目标对象的固有特征和搜索区域的引导来抑制有害干扰物,并使用混合模板提取与目标相关的特征,从而实现更强大的目标建模框架。
Aug, 2023
在本文中,我们提出了两种简单而有效的机制:角度估计和空间遮罩,以解决 Siamese 网络追踪器的旋转和背景干扰问题,并提出了一个名为 Siam-BM 的结果追踪器,它不仅显着提高了追踪性能,而且更重要的是保持了实时性。在 VOT2017 数据集上的评估表明,Siam-BM 实现了 0.335 的 EAO,这使其成为迄今为止表现最佳的实时追踪器。
Sep, 2018
我们提出了一种基于自注意力 / 交叉注意力的目标依赖特征网络,通过深度嵌入多层特征的交叉图像特征相关性,抑制了非目标特征,从而实现了实例变化的特征提取,在不需要额外的相关步骤的情况下可以直接用于预测目标位置,且可以灵活地在丰富的无配对图像上进行预训练,实现了较快的收敛速度和最先进的实时跟踪性能。
Mar, 2022
本文介绍了一种基于增强 Siamese 神经网络的相似性映射的跟踪系统,该系统考虑了外观和几何信息,并可进行端到端的训练,以减少整体系统复杂性和需要针对特定环境进行调整的超参数数量,在 MOT16 挑战中取得了具有竞争性的速度和准确性。
Sep, 2016
本文关注于学习一种能够识别语义背景干扰的 Siamese 追踪网络,提出了一种有效的训练策略和增量学习模块,同时引入局部到全局搜索策略,实现了在多个数据集上的显著表现。
Aug, 2018
本篇论文提出了分别基于 TridentAlign 模块和上下文嵌入模块的连体网络视觉跟踪方法以应对高度变化目标对象和类似类别的干扰对象在视觉跟踪中常常面临的挑战,实验结果表明,该跟踪器的性能可与最先进的跟踪器相媲美,同时实现实时速度。
Jul, 2020
提出了一种仅基于 Transformer 的连体双支路网络,用于目标跟踪。该方法比第一步使用 CNN 提取特征,然后使用 Transformer 融合它们的最佳方法产生更好或可比的结果,在 GOT-10k 和 VOT2020 基准上优于现有技术。此外,该方法实现了实时推理速度(约 40fps)并且代码和模型将被公布。
Dec, 2021
本研究提出一种多层相似性模型来提高红外物体跟踪的辨别能力,其中利用了卷积层计算 TIR 对象的全局语义相似度和本地结构相似度,通过一种相对熵的集成子网络进行集成,并构建了大规模 TIR 视频序列数据集以优化算法效果。
Jun, 2019
本文提出了一种新颖的单分支框架 SyncTrack,通过同步特征提取和匹配,避免了传统的对模板和搜索区域分别进行编码器传递以及引入额外的匹配网络参数,并基于 Transformer 的动态关联实现了同步机制。此外,引入了一种新颖的注意力点采样策略 (APST) 来代替随机 / Farthest Points Sampling (FPS) 方法,通过注意力关系来指导采样,将点采样与特征学习相连接,有助于聚合更加明显和几何特征以进行稀疏点跟踪。在两个基准数据集(KITTI 和 NuScenes)上进行的广泛实验表明,SyncTrack 在实时跟踪方面取得了最先进的性能。
Aug, 2023