Oct, 2019

MelGAN-VC: 基于频谱的任意长度样本的语音转换和音频风格转换

TL;DRMelGAN-VC 使用 GAN 架构、siamese 网络等对非平行语音数据进行语音转换,不仅能精确地将源语音转换为目标语音,还能保留语音信息和灵活地建模目标说话者的风格,同时还能用于音乐风格转换等音频处理应用。