May, 2023

基于语言知识辅助的骨骼动作识别表示学习

TL;DR研究了人类理解和识别他人动作的复杂神经科学问题,提出了一种利用大规模语言模型知识辅助的图卷积网络(LA-GCN)来进行骨架动作识别,采用先验全局关系和先验类别关系提供额外监督,另外使用多跳注意力图卷积以提高拓扑建模中的信息传递效率。在 NTU RGB+D,NTU RGB+D 120 和 NW-UCLA 数据集上实现了最先进的结果。