Mar, 2021
基于步长变换器的时序上下文利用在三维人体姿态估计中的应用
Lifting Transformer for 3D Human Pose Estimation in Video
TL;DR本文提出改进的基于Transformer的Strided Transformer架构,以简单有效地将冗余的2D姿势序列提升到单个3D姿势。通过给Vanilla Transformer编码器换成步幅卷积的方式,降低了序列的冗余性,同时设计了全-单监督方案来约束输出,从而在两个基准数据集上获得了最佳结果并减少了参数。