Jun, 2023

Voicebox: 多语言通用语音生成的文本引导技术大规模应用

TL;DRVoicebox 是实现规模可扩展的非自回归流匹配模型,通过上下文学习可以执行音频转换、噪音去除、内容编辑以及样本生成等多项任务,且在零样本 TTS 合成方面优于 VALL-E 模型。