Oct, 2022

通过-Uplifting-Transformers实现高效三维人体姿势估计的提升和上采样

TL;DR本文提出了一种基于 Transformer 的姿势提升方案,能够处理时间上稀疏的二维姿势序列,但仍能产生时间上密集的三维姿势估计。其采用掩码令牌建模来实现 Transformer 块内的时间上采样,可以大大降低总计算复杂度。在 Human3.6M 和 MPI-INF-3DHP 上评估表明,相对于现有的方法,所提出的方法在保持准确性的同时将推理时间降低了12倍,这提高了在不同应用中使用可变消费者硬件的实时吞吐量。