Apr, 2022
跨语言自监督语音表征,提高口吃症患者的语音识别能力
Cross-lingual Self-Supervised Speech Representations for Improved
Dysarthric Speech Recognition
Abner Hernandez, Paula Andrea Pérez-Toro, Elmar Nöth, Juan Rafael Orozco-Arroyave, Andreas Maier...
TL;DR使用预训练Wav2Vec、Hubert和XLSR模型的声学特征训练自动语音识别系统,对患有言语障碍的英语、西班牙语和意大利语使用者进行识别,结果表明相较于Fbank特征,使用XLSR特征可将识别错误率分别降低6.8%、22.0%和7.0%。