3DYoga90: 一个用于瑜伽姿势理解的分层视频数据集

Oct, 2023

3DYoga90: 一个用于瑜伽姿势理解的分层视频数据集

3DYoga90: A Hierarchical Video Dataset for Yoga Pose Understanding

Seonok Kim

TL;DR我们开发了 3DYoga901，这是一个三层标签层次结构的数据集，包括 RGB 瑜伽动作视频和 3D 骨架序列，对于瑜伽动作识别和姿势评估有着重要的推动作用。

Abstract

The increasing popularity of exercises including yoga and Pilates has created a greater demand for professional exercise video datasets in the realm of artificial intelligence. In this study, we developed 3dyoga901, which is organized within a three-level label hierarchy. We have expan

exercise video dataset 3dyoga901 yoga action recognition pose assessment model variants

发现论文，激发创造

Yoga-82：一个新的用于人体姿势细粒度分类的数据集

本文提出了细粒度分层姿势分类的概念，并提出了一个大规模的瑜伽姿势识别数据集 Yoga-82，包含三个级别的层次结构，以及基于卷积神经网络的多种分类方法。

Apr, 2020

瑜伽姿势的视角无关分类框架

本研究使用从 Human Pose Estimation 模型中提取的 136 个关键点训练 Random Forest 分类器，对 Yogasanas 进行估计，通过测试未见的帧、未见的主题和未见的摄像机角度，提出了评估 Yoga 分类器通用性的三步方案，并分析了迁移学习和目标泄漏的优势和局限性，探讨了交叉验证方法对分类精度的影响，为后续研究提供了数据集和代码。

Jun, 2022

SportsPose -- 一份动态的三维体育姿势数据集

SportsPose 是一个大规模的姿态数据集，包括高度动态的运动。使用超过 176,000 个来自 24 名不同受试者的 5 种运动活动的 3D 姿势，SportsPose 提供了一组反映了运动复杂和动态性的多样化和全面的 3D 姿势。数据集伴随代码，可以从我们的网站上下载，希望 SportsPose 可用于开发和评估更有效的运动表现分析和损伤预防模型。

Apr, 2023

使用单张图像进行瑜伽姿势识别的高效深度卷积神经网络模型

YPose 是一个用于从 RGB 图像中识别瑜伽姿势的卷积神经网络模型，采用基于 EfficientNets 骨干的 CNN 架构进行特征提取，并添加了密集连接网络架构中自适应的密集细化块用于学习更多样化的特征，然后应用全局平均池化和全连接层用于瑜伽姿态的多级分类，其在 Yoga-82 数据集上的表现优于之前的最新技术，准确率达到了 93.28%。

Jun, 2023

细粒度的运动、瑜伽和舞蹈姿势识别：一项基准分析

人体姿势估计是计算机视觉中的一个复杂问题，本研究通过引入深度学习技术和提出的 SYD-Net 模型，在解决体育运动和舞蹈姿势分类问题上取得了显著的进展。

Aug, 2023

HomebrewedDB：用于 3D 物体 6D 姿态估计的 RGB-D 数据集

本文介绍了一个新的数据集和基准测试标准，主要针对从 3D 模型（有纹理和无纹理）训练，可扩展性，遮挡，光照和物体外观的变化等方面测试 6D 姿态估计算法的性能，并使用最先进的 DPOD 检测器来设置基线。

Apr, 2019

层次化舞蹈视频识别无监督 3D 姿态估计

提出了一种分层舞蹈视频识别框架 (HDVR)，它通过估计 2D 姿势序列，跟踪舞者，并同时估计相应的 3D 姿势和 3D 到 2D 成像参数来提取舞蹈的层次结构。我们在多人跟踪和通过 LSTM 网络识别舞蹈类型方面优于现有的 3D 姿势估计方法。

Sep, 2021

大规模多视角 3D 手势姿态数据集

提出一个多视角手势姿势数据集和一个既简单又准确的、用于实时鲁棒的 2D 手势姿势估计的深度学习框架。

Jul, 2017

BigHand2.2M 基准测试：手势姿态数据集和最新技术分析

介绍了一种新的捕捉方法和跟踪系统，自动获取 21 个关节点的手部姿势数据，并通过新数据集和卷积神经网络对自我视角手势估计和交叉基准性能进行显著改进。

Apr, 2017

NTU RGB+D：一个用于 3D 人类活动分析的大规模数据集

本文介绍了一个包含超过 56,000 个视频样本和 4 百万帧的大规模 RGB + D 人体动作识别数据集，其中包括 60 种不同的行为类别，并提出了一种新的循环神经网络结构来更好地对每个身体部位的特征进行长期时间相关性建模。实验结果表明，在跨主体和跨视图评估标准上，应用深度学习方法比最先进的手工制作特征具有优势。

Apr, 2016