Jan, 2017

基于卷积神经网络的大规模孤立手势识别

TL;DR该论文提出了三种简单、紧凑而又有效的深度序列表示方法,分别称为动态深度图像 (DDI)、动态深度法线图像 (DDNI) 和动态深度运动法线图像 (DDMNI)。这些动态图像是从一系列深度图像构建而成的,使用双向排名池化来有效地捕捉时空信息,从而使我们能够对已经训练好的卷积神经网络 (ConvNets) 模型进行微调,以用于深度序列的分类。在该论文提出的基础上,我们开发了一个卷积神经网络 (ConvNets) 方法,用于手势识别,并在 2016 年 ChaLearn Looking at People(LAP)挑战赛的大规模隔离手势识别中进行了评估,达到了 55.57%的分类准确率,并排名第二,虽然只使用了深度数据,但非常接近最佳表现。