CVPRMar, 2023

基于运动捕捉的动作识别的时空网格变换器(STMT)

TL;DR本文提出一种利用 Spatial-Temporal Mesh Transformer(STMT) 直接对网格序列进行建模的方法,通过使用层次 Transformer 结构和自监督任务来实现骨架表示和点云表示无法达到的以空间 - 时间域的非局部关系为基础的人类动作识别,实验结果表明该方法在 MoCap 基准测试上表现卓越。