ICLRMay, 2024

多语种语调转换:比较监督和迁移学习

TL;DR对语音合成系统中的韵律传输领域进行研究,评估了适应多语言环境的预训练单语言文本转语音模型的学习方法,即监督微调和迁移学习。结果表明,与监督微调相比,迁移学习可以显著提高性能,平均 MOS 得分高出 1.53 点,RA 增加 37.5%,MCD 改善了约 7.8 个点。这些发现对于建立低资源语言的文本转语音模型具有重要意义。