May, 2020

扩充语音人数能否提升多说话人端到端语音合成质量?

TL;DR通过创造人工说话者并利用低质量数据的正交方法,我们改进了当前的说话者适应方法,并修改了基础 Tacotron2 模型以说明这些语料库中固有的通道和方言因素,成功对方言进行语音合成,此外还通过合成质量、说话者和方言相似度进行了评估,并检验了说话者增量法的有效性。