Jun, 2020

UWSpeech:未书写语言的语音翻译

TL;DR本文中,我们提出了一种名为 UWSpeech 的翻译系统,它将目标未书写语言转换为离散标记,然后用转换器将源语言语音转换为目标离散标记,最后使用倒置器从目标离散标记中合成目标语音。我们提出了一种名为 XL-VAE 的方法,用于共同训练 UWSpeech 的转换器和倒置器,并在 Fisher 西班牙语–英语交谈翻译数据集上进行了实验证明 UWSpeech 相较于直接翻译和 VQ-VAE 基线的表现提高了 16 和 10 BLEU 分数,证明了 UWSpeech 的优势和潜力。