Sep, 2023

CPSP: 从音素监督中学习语音概念

TL;DR我们提出了一种名为对比音素 - 语音预训练(CPSP)的方法,通过对比学习将音素和语音连接到联合多模态空间,并在帧级别学习如何连接音素和语音,从而实现了最小监督的文本到语音(TTS)、语音转换(VC)和自动语音识别(ASR)任务。