Aug, 2018
辅助分类变分自编码器实现的非平行多对多语音转换
ACVAE-VC: Non-parallel many-to-many voice conversion with auxiliary classifier variational autoencoder
Hirokazu Kameoka, Takuhiro Kaneko, Kou Tanaka, Nobukatsu Hojo
TL;DR本研究提出了一种非平行的一对多语音转换方法,使用一种称为辅助分类器变分自编码器的条件变分自编码器变体。该方法采用全卷积体系结构构建编码器和解码器网络,并使用信息论正则化进行模型训练,避免了声学特征序列中的时间依赖关系丢失。通过引入辅助分类器进行训练,避免了属性类标签对输入语音的控制失效。在非平行的语音身份转换任务中,实验结果表明该简单方法效果良好,避免了模糊声音的产生。