Oct, 2020

并行 Tacotron:非自回归且可控 TTS

TL;DR本文提出了一种用于神经端到端文本到语音的非自回归神经网络模型 Parallel Tacotron,该模型采用变分自编码器来提高自然性,轻量级卷积来捕获局部上下文,并引入迭代光谱损失以进一步提高自然性,实验结果表明,Parallel Tacotron 与强的自回归基线模型相匹配,并在推理时间上显著提高了效率。