基于分割的鲁棒视觉跟踪
本研究提出了一种快速准确的视频目标分割算法,使用一个基于部件跟踪的方法来处理具有大变形、遮挡或杂乱背景的视频,生成部分掩模,最后采用基于相似性得分的函数来完善目标部分。实验结果表明,此算法可在 DAVIS 基准数据集上获得比其他算法更高的分割精度,并实现更快的运行时性能。
Jun, 2018
本研究通过将类别特定的外观模型重新定义为通用的物体状态预测,在两种大规模跟踪基准测评(OxUvA 和 GOT)中实现了最先进的结果,并通过添加一个 mask 预测分支,为跟踪的对象生成实例分割掩模。
Oct, 2019
该论文介绍了一种基于距离变换的对象段表示方法和基于残差解卷积结构的对象掩码网络,实现了跨越边界框的对象分割;并将其整合到一个多任务网络级联框架中,学习了最终二进制对象掩码。实验表明,这种方法在目标生成和实例分割方面优于现有的技术。
Dec, 2016
本文提出了一种新的算法,使用椭圆拟合来估计带有分割(掩膜)的目标的边界框旋转角度和大小,即 SiamMask_E 算法,在保持快速跟踪帧率 (80 fps) 的前提下,改善了现有 SiamMask 算法的边框拟合过程。在使用旋转边框标记的视觉对象跟踪数据集上测试,与原始 SiamMask 相比,我们实现了 0.652 和 0.309 的提升 EAO 的精度,在 VOT2019 上分别比原始 SiamMask 高 0.056 和 0.026。
Jul, 2019
该研究提出了一种基于目标状态估计和分类的新型跟踪架构,该架构通过离线学习将高层次的知识融入到目标状态估计中,以实现前所未有的边界框精度。同时,该架构还引入了一个在线训练的分类组件,以保证对干扰物高度鉴别性能。该跟踪框架在 5 个挑战基准测试中取得了新的 state-of-the-art 结果,在新的大规模 TrackingNet 数据集上取得了 15% 的相对增益,而运行速度超过 30 FPS。
Nov, 2018
HQTrack 是一个面向视频的高质量跟踪框架,主要由视频多目标分割器(VMOS)和掩模细化器(MR)组成,通过 VMOS 将物体掩模传播到当前帧,并利用预训练的 MR 模型来进一步提高跟踪掩模的质量。在 Visual Object Tracking and Segmentation(VOTS2023)挑战中,HQTrack 在不使用任何技巧的情况下,以第二名的成绩取得了显著的效果。
Jul, 2023
通过分析运动模式使用固有的张量结构进行片段分割和目标追踪,该算法在 LaSOT、AVisT、OTB100 和 GOT-10k 等基准测试中取得了有竞争力的结果,并能够实现实时操作。
Sep, 2023
本文介绍了一种利用标记图像数据和未标记视频序列学习实例跟踪网络的半监督框架,采用实例对比目标,利用学习的嵌入区分每个实例并在不同帧之间稳定地跟踪对象,并且将此模块集成到单阶段实例分割和姿态估计框架中,较之两阶段网络显著降低了跟踪的计算复杂度。无需任何视频标注努力,我们的方法可达到与大多数完全监督方法相当甚至更好的性能。
Apr, 2021
该研究介绍了一种名为 SiamMask 的方法,可实现单个简单方法的实时视觉对象跟踪和半监督视频对象分割。 在实时操作过程中,SiamMask 仅依赖于单个边界框初始化,以每秒 55 帧的速度产生类不可知对象分割掩模和旋转边界框。 该方法在 VOT-2018 实时跟踪器中实现了新的最新技术,同时在 DAVIS-2016 和 DAVIS-2017 的半监督视频对象分割任务中提供了最佳速度和最佳性能。
Dec, 2018