Feb, 2020

SkinAugment: 自动编码说话人转换用于自动语音翻译

TL;DR本论文提出了使用自动编码说话人转换进行数据增强的方法,通过直接转换音频序列,使其合成声音与另一位说话人类似。我们的方法在英语到法语和英语到罗马尼亚语的自动语音翻译任务上比 SpecAugment 效果更好。同时,我们还展示了数据增强的数量和多样性的好处,并证明了我们可以将该方法与机器翻译的转录结合起来,在英语到法语自动语音翻译任务上胜过一个非常强大的级联模型。该方法具有广泛适用性,可应用于其他语音生成和分析任务。