Oct, 2023

评估自监督语音表示对美国土著语言的应用

TL;DR应用自监督方法于语音表示学习的研究已引起广泛关注,然而,目前的进展主要集中在只考虑英语的单语模型上。我们在 ASRU 2023 ML-SUPERB 挑战赛的新语言轨道上提交了一份研究报告,其中介绍了一个针对 Quechua 语(一种南美洲土著语言)的 ASR 语料库。我们评估了大规模的自监督学习模型在 Quechua 语以及其他 6 种土著语言(如 Guarani 和 Bribri)的低资源 ASR 上的效果,结果显示最先进的自监督学习模型表现出了惊人的性能,展示了大规模模型在现实数据上的潜在泛化能力。