Mar, 2024

利用数据增强条件式鉴别器训练基于生成对抗网络的声码器模型

TL;DR基于生成对抗网络(GAN)的声码器利用对抗鉴别器进行训练,因其快速、轻量和高质量的特点而被广泛用于语音合成。然而,这种数据驱动模型需要大量训练数据,导致数据收集成本高。为了解决这个问题,我们提出了一种基于增强条件鉴别器(AugCondD)的方法,该方法在评估输入语音时考虑了增强状态,从而避免限制原始非增强分布的学习。实验结果表明,AugCondD 能够在有限数据条件下提高语音质量,并在充足数据条件下达到可比较的语音质量。