Nov, 2020
可控的情感转移用于端到端语音合成
Controllable Emotion Transfer For End-to-End Speech Synthesis
Tao Li, Shan Yang, Liumeng Xue, Lei Xie
TL;DR提出了一种基于 Tacotron 的新方法,通过引入情感分类器和样式损失,增强情感嵌入的区分能力,并通过控制情感嵌入的值,控制合成语音中的情感强度。实验结果表明,该方法合成的语音具有更高的准确性和表现力,并且情感强度的控制更加显著。