Apr, 2018

通过对抗学习分离音频表示进行无平行数据的多目标语音转换

TL;DR该研究提出了一种使用循环一致性对抗网络(Cycle-GAN)和自编码器的声音转换和身份识别方法,可将声音转换为多种不同的说话者,同时实现了说话人特征和语言内容的分离。初步实验结果表明,在没有平行数据的情况下,可取得非常好的语音质量。