Feb, 2020

使用非平行训练数据转换频谱和声调进行情感语音转换

TL;DR提出了一种使用循环生成对抗网络和小波变换将非平行语音数据转化为伪对传递来完成情感音频转换,并通过分解基频到 10 个不同时间尺度进行有效的声调转换,实验结果表明,该框架在客观和主观评估中优于基准。