联合建模动态与外观线索，实现鲁棒的 RGB-T 跟踪

Jul, 2020

联合建模动态与外观线索，实现鲁棒的 RGB-T 跟踪

Jointly Modeling Motion and Appearance Cues for Robust RGB-T Tracking

Pengyu Zhang, Jie Zhao, Dong Wang, Huchuan Lu, Xiaoyun Yang

TL;DR提出了一种通过联合建模外观和运动线索的新型 RGB-T 跟踪框架，利用先进的融合方法并引入跟踪切换机制使其性能显著优于其他同类算法。

Abstract

In this study, we propose a novel rgb-t tracking framework by jointly modeling both appearance and motion cues. First, to obtain a robust appearance model, we develop a novel →

rgb-t tracking motion cues late fusion method multimodal fusion networks tracker switcher

发现论文，激发创造

基于多模态互相提示学习的 RGB-T 跟踪

基于可见光和热红外图像融合的目标跟踪，称为 RGB-T 跟踪，在计算成本较低的情况下如何实现两种模态信息更全面的融合一直是研究人员探索的问题。最近，随着计算机视觉中即时学习的兴起，我们可以更好地将知识从视觉大模型转移到下游任务中。考虑到可见光和热红外模态之间的强互补性，我们提出了一种基于两种模态之间相互即时学习的跟踪架构。我们还设计了一个轻量级的即时学习器，在骨干网络的每一层中嵌入了二维注意机制，以低计算成本将信息从一种模态转移到另一种模态中。广泛的实验证明，我们提出的跟踪架构既有效又高效，在保持高运行速度的同时实现了最先进的性能。

Aug, 2023

从双流到单流：通过互动提示学习和知识蒸馏实现高效的 RGB-T 跟踪

通过可见光图像和红外热图像的融合进行物体跟踪的 RGB-T 跟踪，通过交叉模态相互提示学习的新型两流 RGB-T 跟踪架构，将此模型作为教师指导单流学生模型，通过知识蒸馏技术实现快速学习，实验证明与类似的 RGB-T 跟踪器相比，我们设计的教师模型达到了最高的精确度，而具有相当精确度的学生模型实现了比教师模型快三倍以上的推理速度。

Mar, 2024

基于混合注意力的 RGB-T 跟踪

本文提出了一种基于混合注意机制的 RGB-T 追踪器 (MACFT)，该追踪器在特征提取和特征融合阶段分别利用不同的转换器骨干支路和混合注意操作实现多模式适应性融合，有效提高了 RGB-T 追踪的鲁棒性和适用性。

Apr, 2023

学习面向目标的双重注意力，实现 RGB-T 跟踪的稳健性

本文提出了两种用于 RGB-T 目标跟踪的视觉关注机制，其中包括利用 RGB 和热感数据的局部关注和多模态目标驱动关注估计网络的全局关注。在两个 RGB-T 基准数据集上的实验验证了我们提出算法的有效性。

Aug, 2019

多模态融合的端到端 RGB-T 跟踪

提出了一种融合红外和可见光图像的端到端相似跟踪框架，这个框架通过特征级别的融合机制，在特征提取、目标估计网络和分类器三个主要部件中提高了单模态组件的表现表现，并在 VOT-RGBT2019 数据集上获得了 0.391 的准确率，进而取得 RGBT210 数据集的最佳表现。

Aug, 2019

RGB-T 对象跟踪：基准与基线

该研究提出了一个大规模的 RGB-T 追踪视频基准数据集和一种新的基于图的方法，以学习强大的对象表示并实现多源数据融合的自适应融合，对其他最先进的追踪方法进行比较，并提供了对 RGB-T 对象追踪领域的新见解和潜在研究方向。

May, 2018

挑战感知的 RGBT 跟踪

本文提出了一种新的挑战感知神经网络来处理 RGBT 跟踪中的共享和特异性挑战，包括对模态共享和模态特异性挑战进行聚合和并行嵌入到骨干网络中以有效地形成更具区分性的目标表示。

Jul, 2020

RGBT 跟踪中的密集特征聚合与剪枝

本文提出一种基于深度融合和递归策略的算法用于多模态追踪，该算法利用端到端训练的卷积神经网络的特征表示强化在所有模态中的物体表示，采用全局平均池化和加权随机选择分数进行通道评分和选择，并通过剪枝去除冗余和噪声特征以实现更强的特征表示。在两个 RGBT 追踪基准数据集上的实验结果表明，该算法在 RGB 和 RGBT 追踪方法中实现了明显的最新技术水平。

Jul, 2019

基于时空多模态标记的 Transformer RGBT 跟踪

提出了一种新颖的 Transformer RGBT 跟踪方法，通过融合静态多模态模板和多模态搜索区域中的时空多模态令牌来处理目标外观变化，以实现鲁棒的 RGBT 跟踪，并通过注意机制增强多模态模板令牌的目标特征，从而促进多模态增强的目标变化信息的传递。该方法在三个 RGBT 基准数据集上的实验证明了与其他最先进的跟踪算法相比具有竞争力的性能，帧率可达 39.1。

Jan, 2024

鲁棒的 RGB-T 追踪中的中间融合和多阶段、多形式提示

提出了 M3PT，一种新型的 RGB-T 提示追踪方法，利用中融合和多模和多阶段的视觉提示来解决 RGB-T 追踪中的性能和效率之间的权衡、训练数据的稀缺性等挑战，并在四个具有挑战性的基准测试中超过了现有方法，同时达到了 46.1 fps 的推理速度。

Mar, 2024