Jul, 2023

双流多级动态点变换器用于两人互动识别

TL;DR通过融合局部区域空间信息、外观信息和动作信息,本文提出了一种基于点云的两人交互识别网络。采用一种名为时间间隔帧采样(IFS)的设计帧选择方法,从视频中高效采样帧,捕捉到相对较短的处理时间内更具区分性的信息。然后,通过一个帧特征学习模块和一个两流多级特征聚合模块,从采样帧中提取全局和局部特征,有效地表示与交互相关的局部区域空间信息、外观信息和动作信息。最后,我们应用一种 transformer 对学习到的特征实施自注意力机制进行最终分类。在两个大规模数据集 NTU RGB+D 60 和 NTU RGB+D 120 上进行了大量实验,结果表明我们的网络在所有标准评估设置下优于现有的方法。