Jul, 2022

GlowVC: 面向语言无关的文本自由语音转换的 Mel-spectrogram 空间解缕模型

TL;DR本文提出了 GlowVC: 一种多语言多说话人基于流的无文本语音转换模型。通过考虑两种不同版本的模型,GlowVC-conditional 和 GlowVC-explicit,它们分别根据语音特征对 mel-spectrogram 空间进行建模。我们评估了我们的模型在不同语言和说话人之间的转换过程中的表现,结果表明 GlowVC 模型表现非常优异。