May, 2022

StyleTTS:一种基于样式的生成模型,用于自然且多样化的文本转语音合成

TL;DR提出了 StyleTTS,一种基于风格的生成模型,用于生成具有自然韵律的多样化语音,通过自监督学习表示发声风格,无需明确标记。在内部评估中,该模型在单人和多人语音数据集中均优于最先进的模型。