Mar, 2021

基于步长变换器的时序上下文利用在三维人体姿态估计中的应用

TL;DR本文提出改进的基于 Transformer 的 Strided Transformer 架构,以简单有效地将冗余的 2D 姿势序列提升到单个 3D 姿势。通过给 Vanilla Transformer 编码器换成步幅卷积的方式,降低了序列的冗余性,同时设计了全 - 单监督方案来约束输出,从而在两个基准数据集上获得了最佳结果并减少了参数。