Jun, 2021

VQMIVC: 一种基于向量量化和互信息的无监督语音表示解缠方法,用于一次成音转换

TL;DR本文提出通过使用向量量化 (VQ) 进行内容编码,并在训练期间引入互信息 (MI) 作为相关度度量,从而在无监督的情况下实现内容、说话人和音高表示的适当分离,以提高单次语音转换系统的性能。该方法在保留源语言内容和语调变化的同时,捕捉目标说话人的特征,实现了比现有单次语音转换系统更高的语音自然度和说话人相似度。