基于姿态的 CNN 特征在动作识别中的应用

ICCVJun, 2015

基于姿态的 CNN 特征在动作识别中的应用

P-CNN: Pose-based CNN Features for Action Recognition

Guilhem Chéron, Ivan Laptev, Cordelia Schmid

TL;DR本研究提出了一种基于人体姿势的卷积神经网络描述子（P-CNN），该描述子通过人类身体部位的轨迹聚合运动和外观信息，可以显著提高在 JHMDB 和 MPII Cooking 数据集上进行的人体动作识别的最新表现。

Abstract

This work targets human action recognition in video. While recent methods typically represent actions by statistics of local video feature

human action recognition video pose-based convolutional neural network descriptor motion and appearance information jhmdb and mpii cooking datasets

发现论文，激发创造

姿态估计与动作检测的 R-CNNs

利用卷积神经网络进行人体姿态关键点预测和动作分类的研究，在解决过程中采用一种基于任务损失函数的方法，在 PASCAL VOC 数据集上评估方法并与之前领先的方法进行比较，结果表明我们的方法在关键点和动作预测方面达到了最先进的水平；此外，我们还引入了一个新的动作检测数据集，并使用我们的方法进行了结果展示。

Jun, 2014

姿势来自动作：基于运动的无监督学习姿势特征

本文提出了一种从视频中自动学习姿态特征的无监督方法，该方法利用了动作信号这一与外貌互补且可用于监督的信号，使用一个外貌卷积神经网络和一个运动卷积神经网络来表示姿态和生成动作编码，通过在 FLIC、PASCAL、UCF101 和 HMDB51 数据集上的 fine-tuning 实验证明了其在静态图像动作识别和视频动作识别方面的优越性。

Sep, 2016

基于卷积神经网络的基于骨架的人体动作识别

本文探讨了基于骨架的动作识别在人类动作识别数据集方面的优势，以及深度学习算法在该领域中的应用。同时，研究表明，通过适当的训练技巧、数据增强和优化器，卷积神经网络可以达到与图神经网络相媲美的效果。实验在 NTU-60 数据集上取得了 95% 的准确度。

Jan, 2023

基于骨骼的动作识别再探讨

本文提出了基于 3D 热力图堆叠的 PoseC3D 方法，相较于基于图卷积网络的方法，能够更有效地学习时空特征、更具鲁棒性，并且适用于多人场景，同时在处理过程中也更加易于与其它视觉模态进行结合。在四个具有挑战性的数据集中，PoseC3D 方法均取得了卓越表现。

Apr, 2021

基于部分特征的图卷积神经网络用于动作识别

本文提出了一种基于部件图卷积网络的人体动作识别模型，该模型将骨骼图分为四个子图，并使用相对坐标和时间位移代替 3D 关节点特征，相对于使用整个骨骼图的模型，能够提高识别性能，实现了对挑战性基准数据集 NTURGB+D 和 HDM05 的骨骼动作识别的最先进水平。

Sep, 2018

利用姿态、动作和外观进行动作分类和检测的串联多流网络

本文提出了一种网络体系结构，计算和整合了人类动作识别中最重要的视觉线索：姿态，运动和原始图像，并引入了马尔科夫链模型进行融合，在 HMDB51，J-HMDB 和 NTU RGB+D 数据集上达到最先进的动作分类性能和在 UCF101 和 J-HMDB 数据集上达到最先进的时空动作定位结果。

Apr, 2017

基于 R*CNN 的上下文动作识别

通过利用场景和时下流行的深度学习模型 RCNN 的多区域分类法，作者提出了一种新颖的基于动作的行为识别系统 R*CNN，它不仅可以在 PASAL VOC Action 数据集上实现 90.2% 平均精确率，超过了同领域其他方法，而且还能在 Berkeley Attributes of People 数据集上实现最新最好的人物属性分类效果。

May, 2015

基于卷积神经网络的基础动作识别

本文提出了一种基于卷积神经网络的框架用于骨骼动作识别，通过自动选择重要的骨骼节点和提取时间段提案进行动作分类和检测，在 NTU RGB + D 数据集上获得了 89.3％的验证准确性和 93.7％的 mAP。

Apr, 2017

基于图像卷积神经网络特征的动作识别

本文介绍一种基于卷积神经网络的层级模型，用于动作识别任务。该模型采用最后一层卷积神经网络的输出特征作为基础，并设计了一个层级结构来捕获视频中的时间变化。同时，作者引入了一种用于提取视频关键帧的方法，从而提高了模型的性能表现。通过在多个动作数据集上的实验结果表明，该方法在动作识别任务上取得了优越的性能表现。

Dec, 2015

基于 CNN 的视频动物行为识别与姿态估计：综述

本研究概述了基于卷积神经网络体系结构的人类动作识别和姿态估计方法，并将其用于动物行为分类的技术进化及其架构适应性的分析。

Jan, 2023