基于卷积神经网络的大规模孤立手势识别

Jan, 2017

基于卷积神经网络的大规模孤立手势识别

Large-scale Isolated Gesture Recognition Using Convolutional Neural Networks

Pichao Wang, Wanqing Li, Song Liu, Zhimin Gao, Chang Tang...

TL;DR该论文提出了三种简单、紧凑而又有效的深度序列表示方法，分别称为动态深度图像 (DDI)、动态深度法线图像 (DDNI) 和动态深度运动法线图像 (DDMNI)。这些动态图像是从一系列深度图像构建而成的，使用双向排名池化来有效地捕捉时空信息，从而使我们能够对已经训练好的卷积神经网络 (ConvNets) 模型进行微调，以用于深度序列的分类。在该论文提出的基础上，我们开发了一个卷积神经网络 (ConvNets) 方法，用于手势识别，并在 2016 年 ChaLearn Looking at People（LAP）挑战赛的大规模隔离手势识别中进行了评估，达到了 55.57％的分类准确率，并排名第二，虽然只使用了深度数据，但非常接近最佳表现。

Abstract

This paper proposes three simple, compact yet effective representations of depth sequences, referred to respectively as dynamic depth images (DDI), Dynamic Depth Normal Images (DDNI) and Dynamic Depth Motion Norm

dynamic depth images convnets gesture recognition depth sequences spatial-temporal information

发现论文，激发创造

基于深度池化的卷积神经网络大规模三维动作识别

本论文提出了三种简单、紧凑而有效的深度序列表示，称为 DDI、DDNI 和 DDMNI，用于孤立和连续行为识别。在这些动态图像上，设计了基于 ConvNet 的方法进行行动识别，取得了三个大型数据集上的最先进结果，即 Large-scale Continuous Gesture Recognition Dataset（Jaccard 指数 0.4109）、Large-scale Isolated Gesture Recognition Dataset（59.21％）和 NTU RGB + D Dataset（跨主体 87.08％和跨视角 84.22％），即使只使用深度模态。

Mar, 2018

使用卷积神经网络进行大规模连续手势识别

使用卷积神经网络从连续深度图序列中识别手势，主要方法包括使用数量运动进行个别手势分段、构建改进的深度运动图、通过卷积神经网络进行手势识别和在 ChaLearn LAP Challenge 竞赛中取得第三名的表现。

Aug, 2016

基于一致投票和三维卷积的多模态融合技术用于孤立手势识别

本文提出了一种基于 RGB 和深度视频序列的空间与时间信息互补建模方法，采用卷积二流一致投票网络（2SCVN）和 3D 深度显著性 ConvNet 流（3DDSN）的并行聚合结构，极大提高了细微运动特征的识别准确性，结果在 Chalearn IsoGD 基准测试中优于领先者 10.29％，在 RGBD-HuDaAct 数据集上取得了最佳效果（96.74％），同时进行了定量实验和定性分析。

Nov, 2016

使用卷积神经网络进行实时手势检测与分类

本研究提出了一种层次结构的卷积神经网络架构，通过使用滑动窗口方法，使离线工作的卷积神经网络架构能够高效地在线操作，同时细化了手势检测和分类。该架构达到了 94.04％和 83.82％的离线分类准确率以及可实现良好的在线操作表现。

Jan, 2019

学习识别触摸手势：循环 vs. 卷积特征和动态采样

利用深度神经网络，提出了基于动态采样和时间归一化组件的触摸手势学习方法，可以将变长手势转换为固定长度表示并处理多用户和硬件变化，本文还提出了新的手势数据集并在标准数据集上超越了现有技术并报告了接近完美的性能。

Feb, 2018

基于事件和深度数据的脉冲卷积神经网络手势识别的高效传感器融合

智能系统在我们日常生活中变得越来越重要，需要新的交互方式。本文提出的脉冲卷积神经网络利用事件和深度数据进行手势识别，通过在嵌入式系统上进行离线训练和评估，并使用开源的神经形态计算框架 LAVA 进行模拟。研究结果表明，在深度信息和模态融合中，时间编码及不同编码的数据对网络性能和泛化能力有积极效果。

Jan, 2024

使用动态神经网络进行长距离手势识别

我们提出了一种新颖、准确和高效的手势识别方法，通过动态神经网络从输入传感器数据的手势所在空间区域中选择特征进行进一步处理，从而使网络能够专注于手势识别所需的重要特征，并且在计算效率上优于其他技术。我们在 LD-ConGR 长距离数据集上展示了我们方法的性能，它在识别准确度和计算效率上优于之前的最先进方法。

Aug, 2023

基于卷积神经网络的多普勒雷达手势识别系统

本文提出了一种使用双通道 Doppler 雷达和卷积神经网络的成本效益高的手势识别系统，其在时间 - 频率分析后对手势信号进行分类。实验结果表明，该系统具有 98％的准确性。

Nov, 2017

学习有效的 RGB-D 场景识别表示

该研究介绍一种基于深度学习的 RGB-D 场景识别方法，提出了一种深度学习模型训练的两步骤方法和一种新的 RGB-D 视频数据集，实现了在 RGB-D 图像 (NYUD2 和 SUN RGB-D) 和视频 (ISIA RGB-D) 场景识别方面的最优表现。

Sep, 2018

使用多视角动态图像进行深度视频动作识别

该研究扩展了动态成像技术在深度领域的应用，提出了多视角动态图像的概念，并通过卷积神经网络实现了特征学习与动作分析。

Jun, 2018