ACLSep, 2023
AfriSpeech-200:用于临床和一般领域 ASR 的泛非洲口音语音数据集
AfriSpeech-200: Pan-African Accented Speech Dataset for Clinical and General Domain ASR
Tobi Olatunji, Tejumade Afonja, Aditya Yadavalli, Chris Chinenye Emezue, Sahib Singh...
TL;DR非洲医生与患者之间的比例严重失衡,且存在语音识别算法的种族偏见和非洲口音识别的缺失问题。该研究发布了 AfriSpeech 数据集,为非洲的临床和通用领域的语音识别提供了一个公开的基准测试集和预训练模型。