Aug, 2023

通用可推广的零样本说话者自适应语音合成与解绑表示

TL;DR解决合成声音的自然性和说话人相似度降低的问题,我们提出了一种通用的零样本说话人自适应语音合成和声音转换模型。该模型使用解耦表示学习来改善模型的普适性,并利用变分自动编码器的表示学习能力增强说话人编码器,实验证明我们的模型在未知说话人上有更好的表现。