Mar, 2020

AlignTTS: 无需显式对齐的高效前馈式语音合成系统

TL;DR提出了基于前馈transformer的AlignTTS来预测mel频谱, 通过duration predictor决定每个字符的持续时间,而动态规划技术则用来考虑所有可能的对齐方式,比Transformer TTS更高效且在MOS(平均意见分数)上优于它。