ECCVSep, 2022

AdaFocusV3: 统一的时空动态视频识别

TL;DR本文探索在改进的 AdaFocusV3 框架上,统一时空动态计算的形式,通过在一些信息丰富的三维视频块上激活高性能网络以降低计算成本,并通过自适应轻量的策略网络在每个样本上根据测试时间的需求动态配置视频块数量,模型经过在 ActivityNet,FCVID,Mini-Kinetics,Something-Something V1&V2 和 Diving48 六个基准数据集上的广泛实验结果证明其显著比竞争算法更有效率。