Oct, 2022

基于参考模型的半监督学习在低资源 TTS 中的应用

TL;DR本论文提出了一种半监督学习的神经语音合成方法,该方法专注于在标记目标数据量有限的情况下实现性能相对较好的 TTS,并能解决原来的自回归模型中出现的曝光偏差问题,实验结果表明,该方法能够在目标数据量有限的情况下,显著提高测试数据的语音合成自然度和鲁棒性。