基于半径边界的的深度结构化三维人体活动识别模型
本文提出了一种基于 RGB-D 视频的自动活动识别的深度模型,使用 3D 卷积和最大池化算子,结合激活函数以及学习出活动的时间结构,该模型可以直接作用在原始输入上进行活动分类,而且还允许动态调整模型结构以适应人类活动的时间变化,并在挑战性场景下验证了该方法的优越性,同时还给出了一个大型的 RGB-D 视频人类活动数据库。
Jan, 2015
本文提出了一种用于活动检测的上下文多尺度区域卷积 3D 神经网络 (CMS-RC3D),通过使用时间特征金字塔来表示不同时间尺度的活动实例,并在每个时间特征金字塔的级别上都学习了一个针对特定时间尺度的活动建议检测器和活动分类器,以进行更好的识别。 实验结果表明,CMS-RC3D 探测器在处理所有时间尺度范围内的活动时,仅需通过主干网络进行一次,而在 THUMOS14 数据集上比现有方法表现更好,并在 ActivityNet 数据集上实现了可比较的结果,尽管使用了浅层特征提取器。
Jan, 2018
通过在两个人体活动识别数据集上进行广泛的实验研究,我们调查了常见的深度学习和机器学习方法以及不同的训练机制(如对比学习)和从传感器时间序列数据中提取的各种特征表示的性能,以评估它们在人体活动识别任务中的有效性。
Sep, 2023
本文提出了一种空间 - 时间级联框架,利用深度学习算法提取人类活动的深入特征,并使用双向 Gated 循环单元进行长期时间建模和人类行为识别。实验结果表明,该方法与现有算法相比在帧每秒的执行时间方面提高了最多 167 倍。
Aug, 2022
本文探讨了基于深度学习在普适计算中的人类活动识别(HAR)技术,介绍了如何使用具有创新性的正则化方法训练循环神经网络,提出了适用于 HAR 问题的模型,并通过多个随机实验说明了超参数的影响和模型的适用性。
Apr, 2016
本文提出了一种基于深度神经网络和分层图模型的个人和群体活动监测方案,使用深度网络识别场景中个人的动作,并通过考虑类别间的依赖关系使用神经网络分层图模型完善每个类别的预测标签,该方法能有效改善基准测试方法的识别率。
Jun, 2015
使用深度学习模型(如卷积神经网络和 Transformer)进行人类活动识别,研究表明特征融合对于改善活动识别系统的准确性和稳健性具有重要意义。使用 HuGaDB、PKU-MMD、LARa 和 TUG 数据集,PO-MS-GCN 和 Transformer 模型在准确性上进行了训练和评估,PO-MS-GCN 模型在效果上优于其他先进模型,并且特征融合在不同数据集上改善了结果。
Jun, 2024
该论文提出了两种基于 CNN 的体系结构,包括三种流,可以分别捕捉不同速率的空间和时间信息,并使用双向 LSTM 和注意力机制进一步提高模型性能,实现了人类动作识别任务的最先进表现。
Apr, 2021
我们提出了一种基于 R-C3D 模型的视频流活动检测方法,通过提取关键的时空特征来定位和分类实现高效监测,该模型具有端到端的训练方式和较快的运行速度,在多个数据集上取得了最佳的效果。
Mar, 2017
该研究引入了新模型 R-C3D 来进行连续未修剪视频流的时间活动检测,包括提取有意义的时空特征来捕捉活动、准确定位每个活动的开始和结束时间,并通过将原始 RGB 流与基于光流的运动流进行有效整合,进一步提高了检测性能。通过在三个基准数据集上的实验,该模型在 THUMOS'14 和 Charades 数据集上取得了最先进的结果,并证明其是一种通用的时间活动检测框架。
Jun, 2019