Mar, 2019

逐步稀疏的局部注意力在视频物体检测中的应用

TL;DR该论文提出了一种名为 PSLA 的新型模块,它通过逐步稀疏的步幅在局部区域内建立跨帧特征间的空间对应关系,并使用这个对应关系来传播特征。基于 PSLA,提出了 RFU 和 DenseFT 来分别建模时间外观和丰富特征表示,进而构建了一种新型的视频目标检测框架。实验表明,该方法在模型大小更小、运行时间可接受的情况下取得了最佳准确度。