Mar, 2022

儿童语音合成的文本到语音处理流程、评估方法和初步微调结果

TL;DR本研究通过开发和验证训练管道,使用儿童语音数据集对最先进的神经 TTS 模型进行微调并进行了多方面的评估。结果表明训练后的 TTS 模型能够从只有 5 秒的参考音频样本中合成类似儿童的语音。