ICCVAug, 2023

通过语义感知的时间累积修剪时空令牌

TL;DR为了优化速度和准确度的平衡,我们提出了基于语义感知的时间积累评分(STA)来整体修剪时空令牌。利用 STA 评分,我们能够逐步修剪令牌而不引入额外的参数或需要进一步的再训练。在 Kinetics-400 和 Something-Something V2 上的实证结果表明,使用 STA 模块在 ViT 和 VideoSwin 骨干网络上能够实现超过 30%的计算减少,而准确度下降仅为可忽略的 0.2%。