Mar, 2023

英语口音的爱丁堡国际语料库:迈向英语 ASR 的民主化

TL;DR该论文介绍了一个新的英语语音数据集 Edinburgh International Accents of English Corpus (EdAcc),用于更好地代表各种英语语音的多样性,经使用 680,000 小时的转录数据进行训练后,最好的模型在印度、牙买加和奈及利亚等地的表现都有所下降,平均词错误率为 19.7%。