CVPRMay, 2022

多语言 TTS 的说话人脸生成

TL;DR本论文提出一种多语言对话生成系统,结合了人脸生成和文本到语音系统,可以仅通过文本输入生成多种语言的自然语音、同步口型,无论输入文本的语言如何,均可维持语音人的声音特征。同时,我们添加了翻译 API,展示神经配音技术的应用。