Dec, 2019

压缩视频动作识别的流蒸馏 IP 双流网络

TL;DR该论文提出了一种基于压缩域的双流网络 IP TSN,其中两个流由压缩视频中的两种类型的帧(I 帧和 P 帧)表示,无需独立的时间流,并通过从光流中的广义蒸馏完全利用 P 流的运动信息,极大地提高了效率和精度。该方法在公共视频动作识别基准数据集(UCF101、HMDB51 和 Kinetics 子集)上实验,性能优于其他压缩域方法,同时提高了 20%的总体推理速度。