Aug, 2020

无文本长度限制语音合成系统的韵律学习机制

TL;DR本文提出了一种基于 TTS 系统的韵律学习机制,利用本文语言模型的语义特征改进韵律预测结果,并提出了一种名为局部注意力的自注意力结构,以消除输入文本长度局限性,实验证明,我们的模型在英语和汉语合成中产生了更加令人满意的韵律,尤其在汉语合成中,我们的模型优于基准模型,MOS 差距为 0.08,合成语音的整体自然度得到了显著提高。