Oct, 2023

VoiceExtender: 用引导扩散模型进行短发声无关语音验证

TL;DRVoiceExtender 是一种新的架构,利用两个引导扩散模型和 SE 指导,对基于短话语的语音特征进行增强,从而提高讲话者验证性能。实验证明,相对于基准方法,在 0.5、1.0、1.5 和 2.0 秒短话语条件下,我们的方法在等错误率上分别提高了 46.1%、35.7%、10.4% 和 5.7%。