Jun, 2024

Transformer 从语言到视觉到 MOT 的发展:对基于 Transformer 的多目标跟踪的文献综述

TL;DRtransformer 神经网络结构通过注意力机制实现自回归的序列到序列建模,在自然语言处理和计算机视觉等领域取得了重大突破。本文综述了在计算机视觉领域中应用 transformer 的主要进展,并针对多目标跟踪 (MOT) 进行讨论,指出 transformer 在最新的 MOT 研究中逐渐具备竞争力,但仍然落后于传统深度学习方法。