CVPRNov, 2022

SadTalker:学习逼真的 3D 动作系数,用于风格化音频驱动的单张图像口型动画

TL;DR本文提出了 SadTalker—— 一种生成逼真说话头像视频的方法,通过音频和 3D 运动系数生成 3D 头部姿态和表情,利用 ExpNet 和 PoseVAE 分别进行表情和头部姿态合成,并使用生成的 3D 运动系数合成最终视频,实验结果表明了该方法优于其他方法。