ICCVMay, 2020

TAM:面向视频识别的时间自适应模块

TL;DR该研究提出了一种新的时间自适应模块(TAM),可生成基于其自身特征图的视频特定时间核,采用独特的两级自适应建模方案,通过将动态核解耦为位置敏感重要性地图和位置不变聚合权重,从本地时间窗口中学习重要性地图以捕捉短期信息,从全局视图中生成聚合权重,并成功应用于 TANet 架构中,从而实现卓越的性能表现。