Mar, 2018

基于 Tacotron 的端到端韵律转移实现情感化语音合成

TL;DR本文提出了一个通过学习潜在的韵律嵌入空间,从包含所需韵律的参考声学信号中扩展 Tacotron 语音合成架构的方法,利用学习到的韵律嵌入空间来进行条件控制,达到了即使参考信号和合成说话人不同也能匹配参考语音韵律细节的合成语音效果,并定义了多种定量和主观指标来评估韵律转移,展示了在不同模型上韵律转移任务的结果和相应的音频样本。