Aug, 2018

辅助分类变分自编码器实现的非平行多对多语音转换

TL;DR本研究提出了一种非平行的一对多语音转换方法,使用一种称为辅助分类器变分自编码器的条件变分自编码器变体。该方法采用全卷积体系结构构建编码器和解码器网络,并使用信息论正则化进行模型训练,避免了声学特征序列中的时间依赖关系丢失。通过引入辅助分类器进行训练,避免了属性类标签对输入语音的控制失效。在非平行的语音身份转换任务中,实验结果表明该简单方法效果良好,避免了模糊声音的产生。