Jun, 2023

转化音频驱动的说话脸部合成为文本驱动的

TL;DR该论文提出了一种将预训练的音频驱动人脸合成模型重新编程以使其能够处理文本输入的方法,其中涵盖了文本到音频嵌入、音频驱动模型、语音合成、说话者特征等关键词。