Feb, 2022

Voice Filter: 基于语音转换后处理模块的少样本文本转语音说话人自适应

TL;DR本文提出一种极低资源语音合成方法 Voice Filter,它只需要使用目标发言人的一分钟语音,采用基于声音转换(VC)的后处理模块来增强现有的高质量 TTS 系统,成功地解决了低资源 TTS 系统训练中的质量和可理解性降低的问题,并将少样本 TTS 问题视为 VC 任务。此外,本文还提出使用一种持续可控的 TTS 系统创建平行语音语料库以促进 VC 任务。结果表明,Voice Filter 在多个基于大量语音数据声音的客观和主观度量上表现优异。