Oct, 2020

GraphSpeech: 基于语法感知的图注意力神经网络用于语音合成

TL;DRGraphSpeech 是在图神经网络框架下提出的神经 TTS 模型,明确编码输入词汇单元在句子中的句法关系,并将此信息合并到 TTS 注意机制中产生用于文本合成的字符表示向量。实验表明,GraphSpeech 在频谱和韵律的呈现方面稳定优于 Transformer TTS 基线。