CVPRDec, 2021

MS-TCT: 多尺度时间卷积转换器用于动作检测

TL;DR我们提出了一种基于 ConvTransformer 网络的行动检测方法,通过三个组件(时间编码器、时间尺度混合器和分类器)高效地捕捉视频中的短期和长期时间信息,实验表明该方法在 Charades、TSU 和 MultiTHUMOS 数据集上效果显著优于现有方法。