Oct, 2023

AutoCycle-VC: 以瓶颈独立为目标的零样本跨语言语音转换

TL;DR提出了一个简单而强大的零样本语音转换系统,使用了循环结构和梅尔频谱预处理,通过循环一致性损失考虑目标和源说话者之间的转换,同时利用堆叠的随机排序梅尔频谱和标签平滑方法在说话者编码器训练过程中提取不受时间约束的全局说话者表示,模型在主观和客观评估中表现优于现有的最先进结果,并可促进跨语言语音转换并提高合成语音的质量。