三流网络用于增强动作识别
通过对深度学习模型的全面分析,这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异,并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。
Mar, 2024
本文提出了一种空间 - 时间级联框架,利用深度学习算法提取人类活动的深入特征,并使用双向 Gated 循环单元进行长期时间建模和人类行为识别。实验结果表明,该方法与现有算法相比在帧每秒的执行时间方面提高了最多 167 倍。
Aug, 2022
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
Mar, 2017
本文探讨了基于深度学习的两种方法 —— 单帧卷积神经网络和卷积长短时记忆,以实现从视频中识别人类行为,同时在 UCF50 数据集和实验数据集上对两个模型进行了评估,结果表明单帧 CNN 模型的准确性优于卷积 LSTM 模型。
Apr, 2023
通过利用多模态视频数据,并提出使用两种方法来识别人类行为,包括使用卷积模型处理姿势流,由可调节关注机制控制图片流,最后经过 LSTM 神经网络对不同姿态下的处理进行特征提取,能够在多数据集上大幅度的提高人类行为识别的效果。
Mar, 2017
本文提出了一种基于 RGB-D 视频的自动活动识别的深度模型,使用 3D 卷积和最大池化算子,结合激活函数以及学习出活动的时间结构,该模型可以直接作用在原始输入上进行活动分类,而且还允许动态调整模型结构以适应人类活动的时间变化,并在挑战性场景下验证了该方法的优越性,同时还给出了一个大型的 RGB-D 视频人类活动数据库。
Jan, 2015
本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014
该研究使用 3D 骨架数据和卷积神经网络 (CNN) 和长短期记忆 (LSTM) 方法进行 3D 人体行为分析,证明 CNN 和 LSTM 的分数融合方法可以更有效地捕获空间 - 时间信息,并在 NTU RGB+D 数据集上取得了最先进的结果,在深度视频中的大规模 3D 人体动作分析挑战中排名第一。
Jul, 2017
本文提出了一种网络体系结构,计算和整合了人类动作识别中最重要的视觉线索:姿态,运动和原始图像,并引入了马尔科夫链模型进行融合,在 HMDB51,J-HMDB 和 NTU RGB+D 数据集上达到最先进的动作分类性能和在 UCF101 和 J-HMDB 数据集上达到最先进的时空动作定位结果。
Apr, 2017