Aug, 2020

基于语音帧和语音风格重构损失的富表现力 TTS 训练

TL;DR该研究提出了一种基于 Tacotron 的文本到语音系统的新训练策略,通过使用感知损失函数实现了在样式重建损失下的语音风格的习得,最终在自然度和表现力上都实现了非凡的性能,该模型是首次将感知质量作为损失函数并纳入 Tacotron 训练,从而实现更好的表现力。