MI-Motion 数据集和多人 3D 动作预测基准
本文介绍了一组新的人体运动和视频数据集 MoVi,其中包括 60 名女性和 30 名男性表演 20 种预定义的日常动作和运动,以及一种自选运动。该数据集包含 9 小时的运动捕捉数据、17 小时的 4 个不同视角的视频数据和 6.6 小时的 IMU 数据,同时还描述了数据集的收集和后处理过程,并探讨了该数据集可促进的研究方向。
Mar, 2020
该研究介绍了 Motion-X 数据集及其构建方法,包含全身运动数据、姿态描述、语义标注等,采用高精度、低成本、可扩展的自动化流程进行数据标注,旨在提高生成自然、多样、表达丰富的运动以及进行 3D 人体网格恢复的能力。
Jul, 2023
该论文提出了一种新型的人类运动预测任务,针对多人运动、社交交互和关节运动的复杂性,提出了一种模型框架,通过引入可学习的潜在编码来表示未来动作的意图来实现不同层次的独立个体运动和社交交互建模,在多个数据集上得到了显著的多人预测结果,表现显著优于现有技术水平。
Jun, 2023
提出了一个新的风格多样的运动数据集,用于运动风格转移任务的有效性进行了综合研究,使用了工业标准的人类骨骼结构,释放该数据集以鼓励未来在此领域开展更多的研究。
Jun, 2023
未来人体姿势预测是机器智能的基本应用,本研究引入了一种新的多模态感知驱动的运动预测方法,通过结合外部 3D 场景和内部人类凝视信息来实现高保真度的生成,同时考虑人的意图和场景的语义连贯性,该方法在 3D 人体姿势和轨迹预测上取得了最先进的性能。
May, 2024
本文描述了牛津多动态数据集,该数据集提供了许多复杂的多动态估计问题,包括挑战现有算法的复杂问题以及支持算法开发的简化问题。数据集包含来自静态和动态传感器的观测、多个移动体的不同 3D 运动的数据以及旋转和遮挡等多个问题的实验。它还提供了 110 分钟的数据包括立体和 RGB-D 摄像头图像、IMU 数据和 Vicon 地面真值轨迹,是多动态估计研究的一个有价值的资源。
Jan, 2019
我们提供了一项关于基于文本的三维人体动作检索的研究结果,重点关注跨数据集的泛化问题。通过采用统一的 SMPL 人体格式,我们能够对一个数据集进行训练,对另一个进行测试,或者对多个数据集进行训练。研究结果表明,标准的文本 - 动作基准数据集(如 HumanML3D、KIT Motion-Language 和 BABEL)存在数据集偏差。我们展示了文本增强在一定程度上可以缩小领域差距,但仍存在差距。此外,我们首次提供了使用 BABEL 进行零样本动作识别的结果,而在训练过程中没有使用分类动作标签,开辟了未来研究的新方向。
May, 2024
本研究旨在从文本描述中生成多个人的自然和多样化的群体动作。我们利用大规模图像和视频数据集估计姿势信息,通过基于 Transformer 的扩散框架,实现了多个数据集中任意数量主题或帧的生成。实验证明,我们的方法是第一个能从多样的文本提示中生成高多样性和保真度的多主体运动序列的方法。
May, 2024
本研究提出了 RatPose 数据集,该数据集考虑了个体和环境的影响因素,并提出了一种名为双流场景运动解耦(DMSD)的方法来提高运动预测的鲁棒性,该方法在不同难度的任务中展示了显著的性能提升,同时验证了数据集的泛化能力。
May, 2023