Nov, 2023

单模型和任意模态的视频目标跟踪

TL;DR通过低秩分解和重构技术,我们提出了一种统一跟踪器 Un-Track,该方法通过学习共同的潜在空间来处理任何模态,并且只使用 RGB-X 对来学习共同的表示,在单个基于转换器的体系结构中实现了有效的统一和适应任何缺失的模态,同时无需进行模态特定的微调。在五个具有不同模态的基准数据集上的广泛比较表明,Un-Track 超过了最先进的统一跟踪器和经过模态特定微调的对应物,验证了我们的有效性和实用性。