Mar, 2018

使用时空采样网络的视频物体检测

TL;DR本文提出了一个名为 Spatiotemporal Sampling Network (STSN) 的模型,使用了时间上的可变卷积,在视频中进行目标检测。通过从相邻的帧中学习空间采样特征,本文展示了 STSN 具有鲁棒性,并且不需要额外的监督。该模型在 ImageNet VID 数据集上表现优异,并且相比于之前的视频目标检测方法,本文的方法利用了更简单的设计且对于训练没有光流数据的要求。