Feb, 2021

LVCNet: 高效的条件相关建模网络用于波形生成

TL;DR本文提出了一种名为位置可变卷积的新型条件卷积网络来建模波形序列的依赖关系,其使用具有不同系数的卷积核对不同的波形区间进行卷积操作,该系数根据条件声学特征(如 Mel - 频谱图)预测,基于该方法,我们设计了 LVCNet 进行波形生成,并将其应用于 Parallel WaveGAN 中来设计更高效的声码器,LJSpeech 数据集上的实验结果表明,与原始的 Parallel WaveGAN 相比,我们提出的模型在不降低声音质量的前提下实现了四倍的合成速度提高,从而验证了位置可变卷积的有效性。