May, 2024

朝向通用和盲目的 RGB-X 追踪器

TL;DR我们展示了在 RGB-X 视频目标跟踪上,在统一化时的专门化不必要,通过使用一种称为 XTrack 的单一模型跟踪器,在推理过程中对任何模态 X 保持盲目,以实现输入模态的统一,并实现专门模态的信息表示,从只有配对数据开始,通过简单的训练过程有效地整合了多标签分类损失和路由函数,从而达到了与模态特定模型相媲美的性能。