Oct, 2023

基于原始音标输入和显式韵律建模的文本转语音合成的生成对抗训练

TL;DR通过生成对抗训练的端到端语音合成系统,我们使用明确的语音、音高和时长建模来训练我们的原始音素到音频转换的 Vocoder,并通过几种预训练模型来实验上下文化和去上下文化的词嵌入,同时介绍一种基于离散风格标记的高度表达的字符声音匹配方法。