Mar, 2023

利用自监督表示的鹦鹉 TTS:文本转语音合成

TL;DR提出一种名为 ParrotTTS 的文本转语音建模的替代方法,该方法基于自监督学习方法。ParrotTTS 采用两步方法,在无标签数据上训练语音到语音模型,然后使用文本到嵌入模型将其扩展到 TTS。该方法在自然度方面取得了有竞争力的平均意见分数,但在转录对和讲话者自适应方面明显优于传统 TTS 模型,并进一步为使用通用训练的自监督学习语音模型训练 TTS 模型铺平了道路。