Apr, 2021

MeshTalk: 通过跨模态分离实现从语音到三维面部动画

TL;DR本文提出了一种利用音频生成三维面部动画的通用方法,该方法建立一个针对面部动画的分类潜空间,根据音频相关和不相关的信息进行信息分离,实现面部动画中高度逼真的运动合成结果,包括高准确度的唇部运动,以及未相关到音频信号的面部其他部位的合理动画,此方法在定性和定量方面均优于现有基线,且具有高逼真度。