3DYoga90: 一个用于瑜伽姿势理解的分层视频数据集
本文提出了细粒度分层姿势分类的概念,并提出了一个大规模的瑜伽姿势识别数据集 Yoga-82,包含三个级别的层次结构,以及基于卷积神经网络的多种分类方法。
Apr, 2020
本研究使用从 Human Pose Estimation 模型中提取的 136 个关键点训练 Random Forest 分类器,对 Yogasanas 进行估计,通过测试未见的帧、未见的主题和未见的摄像机角度,提出了评估 Yoga 分类器通用性的三步方案,并分析了迁移学习和目标泄漏的优势和局限性,探讨了交叉验证方法对分类精度的影响,为后续研究提供了数据集和代码。
Jun, 2022
SportsPose 是一个大规模的姿态数据集,包括高度动态的运动。使用超过 176,000 个来自 24 名不同受试者的 5 种运动活动的 3D 姿势,SportsPose 提供了一组反映了运动复杂和动态性的多样化和全面的 3D 姿势。数据集伴随代码,可以从我们的网站上下载,希望 SportsPose 可用于开发和评估更有效的运动表现分析和损伤预防模型。
Apr, 2023
YPose 是一个用于从 RGB 图像中识别瑜伽姿势的卷积神经网络模型,采用基于 EfficientNets 骨干的 CNN 架构进行特征提取,并添加了密集连接网络架构中自适应的密集细化块用于学习更多样化的特征,然后应用全局平均池化和全连接层用于瑜伽姿态的多级分类,其在 Yoga-82 数据集上的表现优于之前的最新技术,准确率达到了 93.28%。
Jun, 2023
人体姿势估计是计算机视觉中的一个复杂问题,本研究通过引入深度学习技术和提出的 SYD-Net 模型,在解决体育运动和舞蹈姿势分类问题上取得了显著的进展。
Aug, 2023
本文介绍了一个新的数据集和基准测试标准,主要针对从 3D 模型(有纹理和无纹理)训练,可扩展性,遮挡,光照和物体外观的变化等方面测试 6D 姿态估计算法的性能,并使用最先进的 DPOD 检测器来设置基线。
Apr, 2019
提出了一种分层舞蹈视频识别框架 (HDVR),它通过估计 2D 姿势序列,跟踪舞者,并同时估计相应的 3D 姿势和 3D 到 2D 成像参数来提取舞蹈的层次结构。我们在多人跟踪和通过 LSTM 网络识别舞蹈类型方面优于现有的 3D 姿势估计方法。
Sep, 2021
介绍了一种新的捕捉方法和跟踪系统,自动获取 21 个关节点的手部姿势数据,并通过新数据集和卷积神经网络对自我视角手势估计和交叉基准性能进行显著改进。
Apr, 2017
本文介绍了一个包含超过 56,000 个视频样本和 4 百万帧的大规模 RGB + D 人体动作识别数据集,其中包括 60 种不同的行为类别,并提出了一种新的循环神经网络结构来更好地对每个身体部位的特征进行长期时间相关性建模。实验结果表明,在跨主体和跨视图评估标准上,应用深度学习方法比最先进的手工制作特征具有优势。
Apr, 2016