一种用于三维动作识别的骨架序列新表示方法
本文利用 3D CNN 提取基于骨架的动作识别的时空信息与深度特征,探讨其与 RNN 的互补性和噪声下的鲁棒性,并在 SmartHome 数据集和 NTU RGB-D 数据集上获得优异的表现。
May, 2017
提出了一种名为 SkeleMotion 的骨骼图像表示法,能够更好地捕捉行为中所涉及的长程关节交互和过滤杂乱运动值,并在 NTU RGB+D 120 数据集上优于现有技术,在 3D 人体动作识别方面取得了成功。
Jul, 2019
这篇研究论文介绍了从基于深度学习架构的角度全面讨论使用三维骨架数据进行动作识别,并详细介绍了基于循环神经网络 (RNN)-based、卷积神经网络 (CNN)-based 和图卷积网络 (GCN)-based 的主流动作识别技术,并介绍了包括 NTU-RGB+D 在内的多个数据集和算法。
Feb, 2020
本文提出了基于 3D 热力图堆叠的 PoseC3D 方法,相较于基于图卷积网络的方法,能够更有效地学习时空特征、更具鲁棒性,并且适用于多人场景,同时在处理过程中也更加易于与其它视觉模态进行结合。在四个具有挑战性的数据集中,PoseC3D 方法均取得了卓越表现。
Apr, 2021
本文介绍了一种基于深度学习和骨骼信息的动作识别方法,该方法采用 CNN 代替 RNN 进行空时信息的提取和处理,将五种空间骨骼特征编码为图像并有效提高了 3D 人体动作分析的精度。
May, 2017
这篇文章介绍了一种针对 3D 人体动作识别领域的改进型骨架图像表示方法 ——Tree Structure Reference Joints Image(TSRJI),并运用于卷积神经网络,实现了最新数据集 NTU RGB+D 120 上的最优结果。
Sep, 2019
本文提出了一种基于卷积神经网络的框架用于骨骼动作识别,通过自动选择重要的骨骼节点和提取时间段提案进行动作分类和检测, 在 NTU RGB + D 数据集上获得了 89.3%的验证准确性和 93.7%的 mAP。
Apr, 2017
本文提出了一种使用 Joint Trajectory Maps(JTM)表示三维骨架序列中的时空信息的方法,然后使用 ConvNets 学习人体动作识别的判别特征,并通过多个 JTM 的评分融合来改善最终识别结果,实验结果表明该方法在多个公共基准数据集上均取得了最先进的结果。
Dec, 2016
本论文提出了一种基于骨骼的人体动作识别方法,该方法采用循环神经网络建模体关节的 3D 位置配置之间的时间依赖关系,利用空间域和时间域共同分析骨架序列中与动作相关信息的潜在来源,并提出了一种有效的基于树状结构的遍历框架,以处理 Kinect 骨架数据中的噪声。该方法采用了新的 LSTM 模块中的门机制,通过学习连续数据的可靠性,并相应地调整长期上下文表示存储在单元的内存单元中输入数据的影响,从而处理骨架数据中的噪声,并提出了一种新颖的多模态特征融合策略。实验结果表明该方法在 7 个具有挑战性的基准数据集上具有很好的效果。
Jun, 2017
该研究使用 3D 骨架数据和卷积神经网络 (CNN) 和长短期记忆 (LSTM) 方法进行 3D 人体行为分析,证明 CNN 和 LSTM 的分数融合方法可以更有效地捕获空间 - 时间信息,并在 NTU RGB+D 数据集上取得了最先进的结果,在深度视频中的大规模 3D 人体动作分析挑战中排名第一。
Jul, 2017