Aug, 2023

音素幻像器:通过集合扩展的单次语音转换

TL;DR提出了一种新颖的方法“音素幻觉生成器”,它可以在仅有目标说话者短音频数据的情况下,生成多样且高保真度的目标音素,从而在语音转换中实现高逼真度和说话者相似度的平衡。