Sep, 2020

从文本、音频、说话者身份的三模态上下文生成言语手势

TL;DR本文提出了一种基于多模态上下文和对抗训练的自动生成手势模型,使用新的手势生成度量标准和主观人类评估表明,该模型优于现有的端到端生成模型。