动作识别:从静态数据集到移动机器人
通过对深度学习模型的全面分析,这项研究揭示了卷积神经网络、循环神经网络和两流卷积神经网络在人体动作识别中的优势和性能差异,并强调了综合模型在实现强大的人体动作识别方面的潜力和优化的研究方向。
Mar, 2024
本文提出了一个可适用于多种应用场景的人体动作识别框架,包含多形式人体检测和对应动作分类两个模块。其中,通过构建开源数据集来训练多形式人体检测模型,从而识别人的整体、上半身或部分身体,并采用动作分类模型来识别跌倒、睡觉等动作。实验结果表明,该框架对于各种应用场景都是有效的,是一种新的面向应用的人体动作识别 AI 范式。
Sep, 2022
本文提出了一种新的人类行为分析概念,即 “无人干预下的人类行为识别”,为了理解行为标签,我们考虑了背景序列对于分类当前大规模行动数据集中的人类动作的影响。通过研究多种精巧的运动表征,我们探讨了一些特征从背景中提取可能过于强。
Aug, 2016
本研究提出了一种新的通过行为分类进行计算机视觉算法性能提高的方法,并且通过消除数据集的混杂因素来比较人类和计算机视觉性能,表明当前计算机视觉算法的性能还有待提高。
Mar, 2020
该论文提出了两种基于 CNN 的体系结构,包括三种流,可以分别捕捉不同速率的空间和时间信息,并使用双向 LSTM 和注意力机制进一步提高模型性能,实现了人类动作识别任务的最先进表现。
Apr, 2021
本文综述了 200 多篇关于视频动作识别的深度学习论文,介绍了 17 个影响模型设计的数据集和深度学习模型的发展历程,包括深度学习适应、双流网络、3D 卷积核和计算效率模型,并对几种方法在典型数据集上进行了基准测试,最后,讨论了视频动作识别面临的问题和未来的研究机会。
Dec, 2020
本文探讨了基于深度学习的两种方法 —— 单帧卷积神经网络和卷积长短时记忆,以实现从视频中识别人类行为,同时在 UCF50 数据集和实验数据集上对两个模型进行了评估,结果表明单帧 CNN 模型的准确性优于卷积 LSTM 模型。
Apr, 2023