- SlowPerception: 自主驾驶中针对视觉感知的物理世界延迟攻击
该论文介绍 SlowPerception,这是针对自主驾驶感知的第一个物理世界延迟攻击,通过生成基于投影仪的通用扰动。SlowPerception 通过在环境中各种表面上战略性地创建众多幽灵物体,显著增加了非极大抑制和多目标跟踪的计算负载, - ControlLoc: 自动驾驶中的视觉感知劫持攻击
介绍了一种新型的物理世界对抗贴片攻击 (ControlLoc),利用两阶段过程,通过识别最佳位置生成贴片,修改感知到的物体位置和形状,在不同条件下以卓越的攻击成功率 (98.1%) 攻击自动驾驶视觉感知,比现有的劫持攻击有效性提高四倍,且在 - 迷雾中的评估:多目标跟踪鲁棒性
通过基于物理的体积雾模拟以及逐帧单目深度估计和雾成像光学模型,在多个不同强度的雾中对领先的多目标跟踪方法进行全面评估,揭示了它们在雾和类似雾的挑战下的局限性。
- 通过量子退火提高多目标跟踪的准确性
这篇研究论文介绍了一种利用量子退火来加快计算速度、通过集成物体跟踪过程提高跟踪准确性的新方法,并提出了一种改进匹配集成过程的方法。利用 MOT 的序列性质,通过逆向退火进一步增强了跟踪方法。实验证实,每个跟踪过程仅需要 3 微秒的退火时间即 - 多目标追踪作为 ID 预测
在多目标跟踪中,我们将目标关联任务视为一种端到端的上下文 ID 预测问题,并提出了一种简化版的 MOTIP 方法,通过直接预测当前帧中物体的 ID 标签来学习跟踪能力,从而避免了繁琐的手工算法。我们的方法在复杂场景中表现出色,并与其他基于 - PNAS-MOT: 多模态物体跟踪的帕累托神经结构搜索
多目标跟踪是自动驾驶中的关键任务。本文采用神经架构搜索(NAS)方法寻找低实时延迟、相对高准确度的高效跟踪架构。同时,提出多模态框架以提高鲁棒性,并通过实验证明算法可以在边缘设备上运行,从而大大降低多模态跟踪的计算需求和延迟。
- CVPR深入研究多物体跟踪的轨迹长尾分布
本研究探索了多目标跟踪数据的分布模式,并发现现有多目标跟踪数据集中存在显著的长尾分布问题。针对这一挑战,我们提出了两种数据增强策略,并引入了 Group Softmax 模块用于 Re-ID,在多个现有跟踪系统中集成我们的方法,经过广泛实验 - DiffMOT:一种基于扩散的实时多目标跟踪器与非线性预测
非线性运动的多目标跟踪中引入扩散概率模型的 DiffMOT 方法能够更准确地预测目标的运动并取得较优的跟踪性能。
- NTrack:一种适用于棉花田中的多目标跟踪器和数据集
通过自动化追踪技术,基于线性关系以及通过数据关联找到检测与追踪之间的对应关系,利用粒子滤波和稠密光流来引导追踪器,该论文介绍了一种独立于检测方法的模块化多物体追踪系统 NTrack,并通过实验证明其在棉铃追踪和计数方面的有效性,超过了其他方 - 多目标跟踪中 ByteTrack 的自适应置信阈值
应用字节跟踪 (ByteTrack) 于多目标跟踪,介绍一种新的自适应途径,通过动态调整置信度阈值实现更好的效果,同时保持与 ByteTrack 相同的运行时间。
- 基于遮挡感知嵌入一致性学习的多目标追踪
基于视觉嵌入的一种新的多目标跟踪方法,通过预测遮挡信息和利用遮挡线索和视觉嵌入生成两个独立的嵌入来解决在线跟踪场景中由于遮挡引起的跟踪中断问题,实验结果表明在有遮挡和无遮挡的跟踪场景中具有良好的性能水平。
- DARTH:针对多目标追踪的整体测试时适应
这篇论文研究了多目标跟踪的测试时间域偏移问题,并引入了 DARTH,一个全面的测试时间适应框架。通过引入检测一致性公式和新颖的补丁对比损失,我们成功适应了目标检测和实例外观表示,在多个领域转移情况下取得了显著性能提升。
- 去噪多目标追踪:面向严重遮挡的方向
本研究分析了传统的卷积神经网络方法和基于 Transformer 的方法在处理遮挡时的局限性,并提出了一种用于多目标跟踪的端到端可训练的去噪 Transformer 模型(DNMOT),通过在训练过程中显式地模拟遮挡情况来解决遮挡带来的挑战 - 无标记跟踪:通过对比相似性学习进行无监督多目标跟踪
本文探索了样本在视频帧之间的潜在一致性,并提出了一种无监督对比相似性学习方法 UCSL,其中包括自对比、交叉对比和模糊对比三个对比模块。我们的方法在现有基准上表现优于现有的无监督方法,并且甚至比许多完全监督方法提供更高的准确性。
- FOLT: 基于光流的无人机视频快速多目标跟踪
通过提出 FOLT 方法,本文致力于解决无人机视角下的多目标跟踪问题,通过采用现代化检测器和轻量级光流提取器,提取目标检测特征和运动特征,并利用光流增强目标检测特征,预测对象在下一帧中的位置,并通过空间匹配方案匹配检测到的对象和预测的对象, - CVPRMotionTrack: 基于 Transformer 的端到端多目标追踪与 LiDAR - 摄像头融合
提出了一种基于 Transformer 的多模态传感器输入的端到端多目标跟踪算法(MotionTrack),它由基于 Transformer 的数据关联(DA)模块和基于 Transformer 的查询增强模块组成,同时实现了多目标检测(M - UTOPIA: 通过跨域适应实现无限制目标跟踪
本文提出了一种跨领域 MOT 自适应方法,以先前的数据集为基础,并通过自我学习和更新来模拟新数据的获取过程,采用自监督学习的策略,实验结果表明在多项挑战性设置中,相比完全监督、无监督和自监督的最新方法,该方法在跟踪度量 MOTA 和 IDF - 使用多物体跟踪的线性文档图像目标检测
本文介绍了使用多目标跟踪(MOT)实现文档图像中线性对象精确实例分割的框架,包括数据集、性能评估以及性能对比。文章还提供了开源的实现,可以区分曲线、擦除、破折号、交叉和 / 或重叠的线性对象实例。
- Type-to-Track: 基于提示的跟踪技术,用于检索任何物体
本文提出了一种使用自然语言描述对象并进行多目标跟踪的新范例,介绍了包含文字描述的视频数据集 GroOT,提出了用于这一任务的两个新的评估协议和评估度量,并采用基于 transformer 的 MENDER 方法开发了一种高效的模型,证明其在 - CVPROVTrack: 开放式词汇多目标跟踪
本研究解决了传统多目标跟踪方法只针对少数预定义对象类型的固有限制,并提出了一种新的任务 Open-vocabulary MOT,进一步开发出一种数据效率优异的开放词汇跟踪器 OVTrack,通过知识蒸馏和数据幻觉策略有效提升图像分类和关联准