Dec, 2023

EMAGE: 通过掩码音频手势建模实现统一的整体共时手势生成

TL;DR提出了 EMAGE 框架,从音频和掩码手势生成全身人体动作,包括面部、局部身体、手部和整体运动。该框架利用了 BEATX 数据集和掩码手势先验知识,通过联合训练实现音频生成手势和掩码手势重建,生成与音频同步的全面动作。