Jun, 2022

构建时空Transformer用于自我中心三维姿态估计

TL;DR本文介绍了一种利用过去帧信息运用自注意的 3D 人体姿态估计方法——Ego-STAN,通过引入 spatio-temporal Transformer 模型和 feature map tokens 实现对大规模训练的加速与计算效率的提高,并在实验中表现出卓越的性能。