- 多目标跟踪的表示对齐对比正则化
利用轻量级单层变压器编码器模型化时空关系,通过基于特征对齐的对比正则化损失将特征引入数据关联阶段,以提高现有跟踪网络的性能和解释性。
- 贝叶斯非参数方法:一种替代深度学习的选择
贝叶斯非参数模型为统计模型选择提供了灵活而强大的框架,使模型复杂性能够适应不同数据集的复杂性,尤其在统计学、计算机科学和电气工程等领域解决复杂挑战方面具有重要意义。本调查意在阐明这些非参数模型的基本特性和理论基础,提供贝叶斯非参数模型的全面 - 将多视角检测和跟踪提升至鸟瞰视角
利用多视角聚合的优势可以解决多目标跟踪和检测中的遮挡和漏检等挑战。通过将所有视图投影到地面并从鸟瞰视图进行检测分析,最近在多视图检测和 3D 物体识别方面的进展显著提高了性能。本文比较现代的无参数和参数化的升降方法与多视角聚合方法,并提出一 - CVPRNetTrack: 使用网络实现高度动态物体的跟踪
NetTrack 是一个高效、通用、经济实惠的追踪框架,通过引入细粒度学习,利用点级视觉线索来构建一个对动态性鲁棒的动态感知关联。它还学习了细粒度的样本选择和匹配方法,以及细粒度的定位。在鸟群追踪 (Bird Flock Tracking) - 多目标跟踪中基于学习的运动模型的探索
本文研究了多目标跟踪领域中使用 Kalman 滤波器的传统方法在面对复杂非线性运动和遮挡等动态环境中的局限性,并探讨了替代 Kalman 滤波器的各种基于学习的运动模型。我们提出了一种名为 MambaTrack 的在线基于运动的跟踪器,它在 - 运动无人机中视角为中心的多目标跟踪与单应矩阵匹配
在这篇论文中,我们针对无人机移动场景中的多目标跟踪(MOT)的挑战,提出了一个新颖的通用视角匹配多目标跟踪(HomView-MOT)框架。我们引入了快速单应矩阵估计算法(FHE)来计算视频帧之间的单应矩阵,并利用多视角单应矩阵学习跨视角的标 - 仅使用坐标进行多目标跟踪的学习数据关联
我们提出了一种新颖的基于 Transformer 的模块,用于解决多目标跟踪中的数据关联问题。该模块使用来自边界框的坐标来估计来自两个不同时间窗口的轨迹对之间的亲和度分数。通过将 TWiX 插入到在线级联匹配流水线中,我们的跟踪器 C-TW - 超越 MOT:语义多对象跟踪
引入了 Semantic Multi-Object Tracking (SMOT) 的研究,旨在估计物体的轨迹并理解与轨迹相关的语义细节,包括实例描述、实例交互和整体视频描述,整合了 “where” 和 “what” 以进行跟踪。同时介绍了 - CVPRDeconfuseTrack: 应对多目标跟踪的混淆问题
通过 Decomposed Data Association(DDA)和 Occlusion-aware Non-Maximum Suppression(ONMS)模块的有针对性的利用,提出了一种名为 DeconfuseTrack 的多目标 - 多目标跟踪的分层视觉表示
我们提出了一种新的多对象跟踪的视觉分层表示范式,并通过关注对象的组合性视觉区域和与背景的对比背景信息,不仅仅局限于语义可视线索(如边界框),而是更有效地区分对象。这种组合性 - 语义 - 上下文层次结构灵活地集成到不同的基于外观的多对象跟踪 - BronchoTrack:用于支气管镜支气管分支级定位的气道腔追踪
创新的实时框架 BronchoTrack 在确保干预质量方面具有关键的分支级定位,包括腔内检测、跟踪和气道关联,通过使用轻量级检测器、多目标跟踪和基于语义气道图的训练无检测气道关联方法等解决了现有方法在速度和泛化性之间的平衡问题。
- MapTrack:在地图中的跟踪
在本文中,我们提出了一种名为 MapTrack 的方法,利用概率图、预测图和协方差自适应卡尔曼滤波器的三个轻量级插件算法,通过增强经典跟踪器 DeepSORT 在拥挤和遮挡场景中的鲁棒性,实现在常用的多目标跟踪基准集(如 MOTS17 和 - UncertaintyTrack: 在多目标追踪中利用检测和定位的不确定性
基于概率目标检测的定位不确定性估计的 2D MOT 方法在自动驾驶中能有效减少误检以及提升 MOTA。
- AM-SORT:多目标跟踪的可调整运动预测器与历史轨迹嵌入
通过引入适应性的运动预测器,即 AM-SORT,将卡尔曼滤波器替换为转换器架构,我们提出了一种基于运动的多目标跟踪方法,从而解决了在涉及非线性运动和遮挡情景时估计未来物体位置的限制。AM-SORT 通过历史轨迹嵌入到转换器中,提取一系列边界 - MoD2T: 模型数据驱动的运动 - 静态物体跟踪方法
MoD2T 是一种结合了传统数学建模和深度学习的多对象跟踪方法,提高了物体运动确 定性和跟踪精确度;通过 MVFI 度量标准评估效果,在多种场景下都取得了显著的成绩。
- iKUN:无需重新训练即可与追踪器对话
通过插入可插拔的知识统一网络 iKUN,本文介绍了一种基于输入文本描述的多目标跟踪方法,其中使用知识统一模块 KUM 来自适应性地提取视觉特征,并引入了神经卡尔曼滤波器 NKF 来动态调整过程噪声和观测噪声,同时提出了测试时相似性校准方法来 - 基于 Transformer 的多目标平滑算法
多目标跟踪是估计一定时间窗口内未知数量对象的状态轨迹的任务。本文提出了一种针对此场景的新型深度学习体系结构,将数据关联任务与平滑任务解耦,比较了提出的平滑器与传统贝叶斯跟踪器及深度学习跟踪器在不同任务中的性能。
- 非受限环境下的多人跟踪和再识别的 Transformer 网络
提出了一个综合的多目标跟踪方法 STMMOT,该方法结合了目标检测和身份链接,能够在长时间内维持目标身份链接,并利用具有注意力机制的鲁棒时空记忆模块和动态查询嵌入来预测目标状态,消除了后处理的需求。
- AAAI多场景广义轨迹全局图解算器结合复合节点用于多物体跟踪
该研究论文提出了一种名为 CoNo-Link 的综合节点信息传递网络,用于建模超长帧信息以进行多目标跟踪,通过将对象轨迹视为节点进行信息交互,改进了图神经网络的特征表示能力,并在多个常用数据集中表现出色。
- AAAIUCMCTrack: 统一相机运动补偿的多目标跟踪
通过引入 UCMCTrack,本研究提出了一种新颖的基于运动模型的跟踪器,它能够有效地应对视频序列中的相机运动,并仅依赖于运动线索,在各种具有挑战性的数据集上取得了最先进的性能。