Mar, 2023

使用您自己的语音发出外语:跨语言神经编解码语言建模

TL;DR本研究提出了一种跨语言神经编解码语言模型,VALL-E X,用于跨语言语音合成,并通过实验证明其在零样本跨语言文本到语音合成和零样本语音到语音翻译任务中能够生成质量高的语音。此外,VALL-E X 可有效缓解外国口音问题,可通过语言 ID 控制。