Jun, 2022

Makerere Radio Speech Corpus: 适用于自动语音识别的 Ganda 无线电语料库

TL;DR本文介绍了一个基于 Coqui STT 开源工具包的 Luganda 语音语料库的开发,该语料库包含了 155 小时的无线电记录,是撒哈拉以南非洲首个公开无线电数据集,用于在没有社交媒体的社会中识别边缘人群的言语和观点。