ECCVMar, 2022

DeciWatch: 一个简单的基准模型,实现 10 倍效率的 2D 和 3D 姿态估计

TL;DR本文提出了名为 DeciWatch 的视频人体姿态估计基线框架,引入了一种简单而有效的样本 - 去噪 - 恢复框架,通过采样稀疏帧并利用人体运动的连续性和轻量级姿态表示。具体来说,DeciWatch 均匀采样少于 10% 的视频帧进行详细估计,使用高效 Transformer 架构去噪估计的 2D/3D 姿势,然后使用另一个基于 Transformer 的网络精确恢复其余帧。在三个视频人体姿势估计实验和四个数据集上,全面的实验结果验证了 DeciWatch 的效率和有效性。