Mar, 2022

无监督文本转语音合成与无监督自动语音识别

TL;DR该论文提出了一种基于对齐模块输出伪文本和另一个合成模块使用伪文本进行训练和实际文本进行推断的无监督文本转语音综合系统,可以在每种语言的10-20小时语音中实现与监督系统相当的性能,并开展了对文本单元和声码器影响的研究。