MMMay, 2024

从 CNN 到 Transformers 的多模态人体动作识别:一项调查

TL;DR多模态人体动作识别的综述研究,重点关注多模态数据融合设计方面的经典和新兴技术,分析了卷积神经网络和 Transformer 建模方法在该问题上的流行趋势和更高效的模型设计选择,并讨论了实践模型训练中的有前景的架构和融合设计选择,以及多模态数据集的规模和评估视角,提出了多模态人体动作识别的挑战与未来发展方向。