L2STM 是一种通过学习独立的隐藏状态转移来增强模型的时间动力学建模能力以及解决长期时间动态不稳定的问题的方法,结合多模态训练程序,在人类动作识别方面表现优于现有的基于 LSTM 和 / 或 CNN 的方法。
Aug, 2017
该研究使用 3D 骨架数据和卷积神经网络 (CNN) 和长短期记忆 (LSTM) 方法进行 3D 人体行为分析,证明 CNN 和 LSTM 的分数融合方法可以更有效地捕获空间 - 时间信息,并在 NTU RGB+D 数据集上取得了最先进的结果,在深度视频中的大规模 3D 人体动作分析挑战中排名第一。
Jul, 2017
为了最好地利用时空信息,我们研究了在空间和时间上融合 ConvNet 塔的多种方法,并发现在卷积层融合空间和时间网络而不是在 softmax 层融合可以大大减少参数。我们提出了一种新的 ConvNet 架构,以融合视频片段的空时信息,并在标准基准测试中评估了其性能,该架构达到了最先进的结果。
Apr, 2016
本文提出了一种混合式深度学习框架,旨在对视频的静态空间信息、短期运动以及长期时间线索进行建模,并且在 UCF-101 人体动作和 Columbia 消费者视频两个标注数据集上实验,结果表明该框架相对于传统策略具有更高的性能.
Apr, 2015
通过对深度学习模型的全面分析,这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异,并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。
Mar, 2024
本文探讨了基于深度学习的两种方法 —— 单帧卷积神经网络和卷积长短时记忆,以实现从视频中识别人类行为,同时在 UCF50 数据集和实验数据集上对两个模型进行了评估,结果表明单帧 CNN 模型的准确性优于卷积 LSTM 模型。
Apr, 2023
该研究提出了一种新颖的深度监督神经网络模型,利用了视觉跟踪,并结合了深度卷积神经网络(CNN)和循环神经网络(RNN)的鲁棒性来进行视频动作识别任务。研究结果表明,该模型在 UCF101 和 HMDB51 这两个具有挑战性的数据集上表现出色,仅使用卷积特征就可以达到最先进的水平。
Jul, 2016
本研究介绍了一种基于 ResNet-101 的两个强大的基线二流卷积神经网络,并比较分析了使用循环神经网络和 Temporal-ConvNets 来提取时空特征的方法。研究得出,在 UCF101 和 HMDB51 数据集上的实验结果表明,使用 LSTM 和 Temporal-ConvNets 处理时空特征矩阵可以提高总体性能,并发现了每种方法的特定局限性,可作为未来研究的基础。
Mar, 2017
本论文提出了一种通过将循环神经网络和卷积神经网络相结合运用于动作识别的算法,通过 SVM 对特征进行分类,实验结果表明,在标准数据集上,该算法提高了 14% 的识别率。
本文提出了一种基于深度卷积神经网络的两通道 ConvNet 架构,结合了空间和时间网络,利用稀疏光流信息进行训练并使用多任务学习提高模型性能,成功地提高了视频动作识别的准确率。
Jun, 2014