Nov, 2018

端到端语音合成的鲁棒性和精细语调控制

TL;DR该研究提出了一种利用时间结构的音调嵌入方法,实现对合成语音言语风格的精细控制,可在帧级别和音素级别改变合成语音的音高和振幅,并且通过嵌入的时间归一化得到更好的抵抗讲话风格扰动的鲁棒性。