Jul, 2023

SC VALL-E:风格可控的零样本文本到语音合成器

TL;DR本研究提出了基于神经编解码语言模型(VALL-E)的风格控制(SC)VALL-E 模型,用以生成具有可控属性的表达性语音,并通过与其他模型的比较实验评估其性能。