CVPRMar, 2023

使用渐进式视频变换器进行端到端多人 3D 姿势和形状估计

TL;DR本研究提出了一种新的端到端的多人三维姿势和形状估计框架,称为 PSVT,其中使用逐步视频变换器和姿势引导注意力来捕获全局时空上下文,进一步提高了性能。