Jun, 2023

从像素中看姿态:在视觉 Transformer 中学习姿态感知表征

TL;DR本文探讨了将姿态结合到RGB数据中,以学习更细颗粒度和视角不可知的多元表示,并提出了两种学习姿态感知表示的策略,分别为PAAB和PAAT,它们在多个不同的下游视频分析任务中有效,其中PAAT略胜于PAAB。