Oct, 2019

使用最先进的神经说话人嵌入进行零样本多说话人文本转语音

TL;DR研究了使用多说话人建模中的神经发音人嵌入对零样本适应的影响,发现使用可学习字典编码的说话人嵌入,能够在说话人验证任务中提高等误差率,在未知说话人使用时提高零样本适应性,并提高端到端语音合成的说话人相似性和自然度。