Jun, 2024

应用 ASV 进行语音识别:TTS 模型中 VC 和持续性预测改进的应用

TL;DR该论文介绍了一种自动发言人验证系统,以从目标发言人的音频中提取嵌入信息,用于获取他的声音的重要特征,如音高、能量和音素的持续时间,并在多声音 TTS 流水线中使用该信息。