Apr, 2024

FlashSpeech:高效零射击语音合成

TL;DR闪电语音是一种大规模零样本语音合成系统,使用比之前的方法推理时间约占 5%,具有高音质和高相似性的性能,同时实现了语音处理的多样性。