Nov, 2020

VAW-GAN: 一种用于语音情感元素解耦和重组的方法

TL;DR本篇研究通过变分自编码 Wasserstein 生成对抗网络(VAW-GAN)研究情感音频的解耦和重组,提出一种基于 VAW-GAN 的发言者依赖型情感语音转换框架,包括两个 VAW-GAN 管道,一个用于频谱转换,另一个用于韵律转换,在客观和主观评估中验证了我们提出的方法的有效性。