Jun, 2023

Mega-TTS: 具有本征归纳偏置的大规模零样本文本转语音

TL;DR该研究基于语音属性的分解和对应的感性偏见,提出了一种基于方谱的 TTS 系统 Mega-TTS,训练了 20k 小时的语音数据,实现了零样本文本到语音的高质量生成。