Sep, 2022

ParaTTS: 基于段落的语音合成中学习跨句子的语言和韵律信息

TL;DR本文提出了一种基于跨句嵌入结构的 TTS 模型,包含语言学信息,韵律信息和位置信息,并在女性普通话语音书籍语料库上进行了训练,结果表明该模型能够生成自然、优质的段落朗读文本,且在主观和客观测试中都表现优于基于句子的模型。