Mar, 2021
通过空间和时间变换器进行端到端多目标跟踪,超越两帧限制
Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using
Spatial and Temporal Transformers
TL;DR使用Transformer和时空嵌入的MO3TR方法,具有空间和时间注意机制,无需显式的数据聚类模块或任何启发式方法,成功解决了多物体追踪过程中的诸多挑战,表现方面同多个popular MOT图像和视频基准测试的现有最先进技术几乎相当或更好。