AAAIJan, 2023

StyleTalk:可控话语风格的单镜头说话人生成

TL;DR提出了一种一次性风格可控的说话人脸生成框架,可以从任意参考说话视频中获得一种说话风格,并将一次性画像驱动为使用参考说话风格和其他音频进行说话。