用于人体姿态估计和跟踪的简单基线
本研究旨在建立 “PoseTrack” 的标准,该标准是一种基于视频的多人姿势估计和关节跟踪的大规模基准,该基准将集合人类视觉分析研究人员的团体,通过提供大型代表性训练数据集,为研究提供平台并客观评估和比较提出的方法。
Oct, 2017
本文提出了名为 DeciWatch 的视频人体姿态估计基线框架,引入了一种简单而有效的样本 - 去噪 - 恢复框架,通过采样稀疏帧并利用人体运动的连续性和轻量级姿态表示。具体来说,DeciWatch 均匀采样少于 10% 的视频帧进行详细估计,使用高效 Transformer 架构去噪估计的 2D/3D 姿势,然后使用另一个基于 Transformer 的网络精确恢复其余帧。在三个视频人体姿势估计实验和四个数据集上,全面的实验结果验证了 DeciWatch 的效率和有效性。
Mar, 2022
通过构建一个借助于当前技术能在控制误差较低前提下从 2D 开环位置中提取 3D 位置任务的相对简单的深度前向网络,我们发现了现代深度 3D 姿态估计系统的可视分析引起的错误是其主要问题。
May, 2017
使用自顶向下的方法,建立了一个由三个模块组成的强基准系统,分别为人体候选检测器、单人姿态估计器和人体姿态跟踪器。该方法使用了先进的通用物体检测器来检测人体候选者,并使用级联金字塔网络来估计相应的人体姿态,最后使用基于光流的姿态跟踪器进行多目标姿态跟踪。经过大量实验验证了各种模型和配置,该方法成功参加了两个 ECCV18 PoseTrack 挑战:姿态估计和姿态跟踪。
Jan, 2019
本文综述了过去五年间的主要人体姿势估计方法,重点关注指标、基准和方法结构,提出了基于准确性、速度和鲁棒性的分类方法,并得出了未来研究的方向。
Oct, 2020
该论文提出了一种基于最新的人体检测和视频理解技术的轻量化人体关键点估计和跟踪方法,在帧级别和短视频片段中进行关键点估计,并进行轻量级跟踪,领先于多项竞争者,成为 2017 年 ICCV PoseTrack 的关键点跟踪挑战的最佳表现。
Dec, 2017
本文通过一个名为 ViTPose 的基础模型展示了纯视觉 Transformer 在姿态估计任务中的潜力,该模型结构简单、可扩展、训练方式灵活,并在多关键点检测中取得了优异的性能,其中大模型最高精度达到当前最佳水平。
Apr, 2022
通过改进下联式方法,提出了一种改进的多人姿势估计方法,该方法使用更直观却更合理的表示方法,具有 attention 机制的改进型叠叠层沙漏网络,专门用于 hard keypoint 和 keypoint 关联挖掘的新型 Focal L2 Loss 和用于将检测到的关键点分组为单个姿势的强大贪婪关键点分配算法,平均精度比基准线高约 15%,与 MS-COCO 测试数据集上的最新技术相当。
Nov, 2019
本文介绍了基于深度学习的 2D 和 3D 人体姿态估计的综述,系统分析和比较了这些解决方案,对研究的挑战,应用和未来方向进行了讨论,包括 250 多篇研究论文以及姿态估计数据集和评估指标的定量表现比较和讨论。
Dec, 2020
本文提出了一种简单且有效的单人运动预测模型,在不使用视觉和社交信息的情况下,通过有用的训练技巧取得了很好的效果,该方法在 SoMoF 基准测试上表现非常优越,为未来研究提供了新的思路。
Oct, 2021