May, 2024

多模态物体跟踪的卓越性能

TL;DR多模态目标跟踪是一个新兴领域,它利用来自各种模态的数据(比如视觉、深度、红外热像、事件、语言和音频)来估计视频序列中任意物体的状态。本研究综述了现有多模态目标跟踪任务,并分析总结了各个任务的常用数据集和主流的跟踪算法,重点关注了它们基于自监督学习、提示学习、知识蒸馏、生成模型和状态空间模型等技术范式。同时,在此网址上维护了一个持续更新的多模态目标跟踪论文清单。