Oct, 2022

Adapitch: 基于音调分离无转录数据的多说话人文本到语音自适应

TL;DR本篇论文提出 Adapitch 方法,使用无字幕数据对受监督模型进行自适应,并设计了两个自监督模块对文本编码器和 Mel 解码器进行训练,以增强文本和 Mel 的表征能力,同时使用内容分解的有条件 TTS 模块更好地处理合成音中的韵律信息。实验结果表明,Adapitch 比基准方法具有更好的语音合成质量。