Oct, 2022

无文本直接语音翻译与离散语音表示

TL;DR本文提出了一种基于Translatotron 2的 Textless Translatotron模型,使用预处理的无监督语音数据的语音编码器进行训练,针对缺乏书面形式的语言进行端到端的直接语音翻译,效果优于之前的最佳无文本模型,且在多语言和双语语料库上,翻译质量几乎与Translatotron 2相当。