May, 2020

DiscreTalk: 将文本转语音作为机器翻译问题

TL;DR本文提出了一种基于神经机器翻译 (NMT) 的全自动文本语音 (E2E-TTS) 模型,该模型由非自回归向量量化变分自动编码器 (VQ-VAE) 模型和自回归 Transformer-NMT 模型两部分组成,实验结果表明,该模型在自然度方面表现优异,可与 VQ-VAE 模型的重构相媲美。