Feb, 2018

基于短暂无转录样本的新说话人匹配

TL;DR我们提出了一种基于学习的文本转语音系统,通过使用嵌入空间内的网络来从短的未转录音频样本中捕获新说话者,实现了语音合成系统的极大性能提升,且适用于新的声音,即使从非常短的样本中拟合。