Oct, 2022

Virtuoso: 巨量多语种语音 - 文本联合半监督学习用于文本转语音

TL;DRVirtuoso 是一种大规模多语种语音 - 文本联合半监督学习框架,用于文本到语音合成,并且能够在低资源语言中综合处理多种类型的语音和文本数据集,从而可以实现在看到的语言和未看到的语言中实现比基线模型更好的自然度和可懂性。