MMOct, 2021

为实现逼真的音频驱动的说话人脸合成而模仿任意说话风格

TL;DR本文提出了一种基于 3D 可变形模型统计参数的语音驱动说话人脸合成方法,通过无监督学习从野外的说话视频中学习特征,可以模仿任意视频中的任意风格,并且可以生成新的样式,实验证明此方法相比基线方法能够更自然、更具表现力地合成说话风格。