ICCVNov, 2018

TSM: 高效视频理解的时间位移模块

TL;DR该论文提出了一种基于 Temporal Shift Module 的 2D CNN 模型,既具有 3D CNN 的性能又保持了 2D CNN 的计算复杂度,并将该模型扩展至在线设置中,实现实时低延迟的在线视频识别和视频对象检测。该模型在 Something-Something 数据集上性能卓越,在 Jetson Nano 和 Galaxy Note8 等设备上的延迟也很低。