ECCVJul, 2022

基于 Transformer 的分离模态交叉注意力 3D 人体网格恢复

TL;DR本文研究了 Transformer Encoder 在 3D 人类网格重建上的应用。提出了一种名为 FastMETRO 的新型 Transformer Encoder-Decoder 结构,对输入标记的复杂性进行了解耦,并通过注意掩码和网格上采样操作引入人体形态学关系的先验知识来提高其收敛速度和准确性。在 Human3.6M 和 3DPW 数据集上,和基于图像的方法相比明显更有效。