三流网络用于增强动作识别

CVPRApr, 2021

Three-stream network for enriched Action Recognition

Ivaxi Sheth

TL;DR该论文提出了两种基于 CNN 的体系结构，包括三种流，可以分别捕捉不同速率的空间和时间信息，并使用双向 LSTM 和注意力机制进一步提高模型性能，实现了人类动作识别任务的最先进表现。

Abstract

Understanding accurate information on human behaviours is one of the most important tasks in machine intelligence. human activity recognition that aims to understand human activities from a video is a challenging task due to various problems including background, camera motion and data

human activity recognition cnn architectures bidirectional lstm attention heads state-of-art performance

发现论文，激发创造

视频数据中人类行为识别的深度学习方法

通过对深度学习模型的全面分析，这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异，并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。

Mar, 2024

使用级联双注意力 CNN 和双向 GRU 框架的人体运动识别

本文提出了一种空间 - 时间级联框架，利用深度学习算法提取人类活动的深入特征，并使用双向 Gated 循环单元进行长期时间建模和人类行为识别。实验结果表明，该方法与现有算法相比在帧每秒的执行时间方面提高了最多 167 倍。

Aug, 2022

用于 3D 视频中动作识别的双流 RNN/CNN

本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法，通过 SVM 对特征进行分类，实验结果表明，在标准数据集上，该算法提高了 14% 的识别率。

Mar, 2017

使用深度学习方法和单帧 CNN 及卷积 LSTM 进行人类活动识别

本文探讨了基于深度学习的两种方法 —— 单帧卷积神经网络和卷积长短时记忆，以实现从视频中识别人类行为，同时在 UCF50 数据集和实验数据集上对两个模型进行了评估，结果表明单帧 CNN 模型的准确性优于卷积 LSTM 模型。

Apr, 2023

针对人类动作识别的姿态条件的时空关注

通过利用多模态视频数据，并提出使用两种方法来识别人类行为，包括使用卷积模型处理姿势流，由可调节关注机制控制图片流，最后经过 LSTM 神经网络对不同姿态下的处理进行特征提取，能够在多数据集上大幅度的提高人类行为识别的效果。

Mar, 2017

可重构卷积神经网络实现的三维人体活动识别

本文提出了一种基于 RGB-D 视频的自动活动识别的深度模型，使用 3D 卷积和最大池化算子，结合激活函数以及学习出活动的时间结构，该模型可以直接作用在原始输入上进行活动分类，而且还允许动态调整模型结构以适应人类活动的时间变化，并在挑战性场景下验证了该方法的优越性，同时还给出了一个大型的 RGB-D 视频人类活动数据库。

Jan, 2015

用于视频动作识别的双流卷积神经网络

本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构，结合了空间和时间网络，利用稀疏光流信息进行训练并使用多任务学习提高模型性能，成功地提高了视频动作识别的准确率。

Jun, 2014

视频人体动作识别中的深度神经网络：综述

本篇论文研究了基于视频的人体行为识别任务，通过比较现有的深度学习框架（尤其是视频动作识别的表现）和机器学习框架，提出了多项新颖的研究方案。

May, 2023

基于 LSTM 和 CNN 的骨架动作识别

该研究使用 3D 骨架数据和卷积神经网络 (CNN) 和长短期记忆 (LSTM) 方法进行 3D 人体行为分析，证明 CNN 和 LSTM 的分数融合方法可以更有效地捕获空间 - 时间信息，并在 NTU RGB+D 数据集上取得了最先进的结果，在深度视频中的大规模 3D 人体动作分析挑战中排名第一。

Jul, 2017

利用姿态、动作和外观进行动作分类和检测的串联多流网络

本文提出了一种网络体系结构，计算和整合了人类动作识别中最重要的视觉线索：姿态，运动和原始图像，并引入了马尔科夫链模型进行融合，在 HMDB51，J-HMDB 和 NTU RGB+D 数据集上达到最先进的动作分类性能和在 UCF101 和 J-HMDB 数据集上达到最先进的时空动作定位结果。

Apr, 2017