CVPRApr, 2021

FrameExit:面向高效视频识别的条件式提前退出

TL;DR本文提出了一种条件早期退出框架,它采用简单的采样策略和级联的门控模块来自动决定处理最早推理的时点,在需要的情况下提供实时监督信号来提供精度和计算成本之间的动态权衡,以实现高效的视频识别。该方法在三个大规模视频基准测试中均优于竞争方法,在 ActivityNet1.3 和 mini-kinetics 上甚至具有 1.3 倍和 2.1 倍的计算成本降低。此外,该方法在 HVU 基准测试上确立了高效视频理解的新状态。