Mar, 2022

基于混合 ASR 瓶颈特征的内容和细粒度韵律信息解耦用于语音转换

TL;DR该研究提出了一种使用来自连接时序分类损失和交叉熵损失自动语音识别模型提取的混合瓶颈特征的任何到一语音转换方法,并使用渐变反转层和实例归一化从两种瓶颈特征中提取信息以提高相似度、自然度和语音质量。