Apr, 2022

使用保留音色的音高增强提高 FastPitch 的音高可控性

TL;DR本文介绍了针对最近开发的 FastPitch 说话人的音调控制模型,其生成的语音质量对平均音高偏离较大的音高值下降的问题,并提出了两种算法来改善 FastPitch 的鲁棒性,一是保留音色的变调算法,二是使用不同音高范围的语料库定义 FastPitch 的训练算法,实验结果表明这些算法可以提高 FastPitch 的音高控制能力。