Apr, 2023

基于音频驱动的面部动态表情多样而逼真的生成技术

TL;DRDIRFA 是一种新的方法,可以通过基于 Transformer 的概率映射网络生成出同一音频驱动下具有多样化但真实面部动画的语音合成人脸,并能通过源图像使用通用生成网络合成出逼真的说话人脸。