Oct, 2021

DelightfulTTS: 微软语音合成系统参加暴雪挑战 2021

TL;DR本文描述了 Microsoft 的端到端神经文本语音合成系统:用于 Blizzard Challenge 2021 的 DelightfulTTS。该系统在两个方面实现了将文本合成成自然且高质量的语音:一方面是直接建模和生成 48 kHz 采样率的波形,另一方面是通过系统化设计来建模语音中的变化信息,从而提高韵律和自然度。