Oct, 2022

多视角人体网格翻译器

TL;DR本文提出一种新的多视角人体网格翻译器(MMT)模型,通过利用多视角图像和视觉转换器来解决单视角方法的病态问题,同时在编码和解码阶段融合不同视角的特征,并通过交叉视图对齐来确保令牌集中于人类姿势和形状。实验表明,MMT 模型在人体网格恢复任务上表现出很大优势,特别是在具有挑战性的 HUMBI 数据集上的 MPVE 方面,优于现有的单视角或多视角模型,提高 28.8%。