Jun, 2022

UTTS:基于条件去耦合序列变分自编码器的无监督语音合成

TL;DR本文提出了一种新的无监督文本到语音(UTTS)框架,支持零样本语音克隆和高自然度、可理解度语音合成,是从分离的语音表示学习的角度开发的多说话人语音合成器,其利用了最近在自监督语音表示学习和语音合成前端技术方面的先进进展,在训练期间提供了条件分离的时序变分自编码器(C-DSVAE)作为骨干 UTTS AM。