IJCAIMay, 2022
基于关注运动增强的跨模态交互表征学习压缩视频动作识别
Representation Learning for Compressed Video Action Recognition via Attentive Cross-modal Interaction with Motion Enhancement
Bing Li, Jiaxin Chen, Dongming Zhang, Xiuguo Bao, Di Huang
TL;DR本研究提出了一种新的框架 MEACI-Net,采用 RGB 模态和运动模态,并针对压缩视频动作识别常见的问题,加入了 Motion Enhancement、Selective Motion Complement 和 Cross-Modality Augment 模块,实现了两种模态间的交互作用和特征增强,有效提高了识别准确率和计算效率。