Mar, 2021

并行 Tacotron 2: 一种具有可微分时长建模的非自回归神经 TTS 模型

TL;DR本文介绍了 Parallel Tacotron 2,这是一种具有完全可区分持续时间模型的非自回归神经文本转语音模型,该模型不需要受监督的持续时间信号,它的持续时间控制能力得到了证明,并且在多种多人评估中,其主观自然性超越了基线。