Apr, 2018
通过对抗学习分离音频表示进行无平行数据的多目标语音转换
Multi-target Voice Conversion without Parallel Data by Adversarially Learning Disentangled Audio Representations
Ju-chieh Chou, Cheng-chieh Yeh, Hung-yi Lee, Lin-shan Lee
TL;DR该研究提出了一种使用循环一致性对抗网络(Cycle-GAN)和自编码器的声音转换和身份识别方法,可将声音转换为多种不同的说话者,同时实现了说话人特征和语言内容的分离。初步实验结果表明,在没有平行数据的情况下,可取得非常好的语音质量。