Oct, 2022

利用密集时空位置编码追踪目标

TL;DR提出一种新的范式,使用 transformers 对视频中的目标位置进行编码,该模型 DST (position encoding) 以密集的像素方式编码了空间时间位置信息,并将其与变压器结合以进行多目标跟踪。