Apr, 2022

跨语言自监督语音表征,提高口吃症患者的语音识别能力

TL;DR使用预训练Wav2Vec、Hubert和XLSR模型的声学特征训练自动语音识别系统,对患有言语障碍的英语、西班牙语和意大利语使用者进行识别,结果表明相较于Fbank特征,使用XLSR特征可将识别错误率分别降低6.8%、22.0%和7.0%。