Apr, 2024

基于多尺度时空自注意力图卷积网络的基于骨架的动作识别

TL;DR通过使用自注意力图卷积网络 (GCN) 技术,本研究提出了一种混合模型,名为多尺度时空自注意力网络 (MSST-GCN),以有效提高建模能力,并在多个数据集上取得了最先进的结果。该模型利用自空间注意力模块来理解帧内不同身体部位之间的关系,利用自时间注意力模块来研究节点帧之间的相关性。随后,通过多尺度卷积网络捕获节点的长程时空依赖关系,将它们组合成高层次的时空表示,并使用 softmax 分类器输出预测的动作。