Jul, 2022

Huqariq: 秘鲁原生语言的多语言语音语料库用于语音识别

TL;DR使用众包方式收集,秘鲁土著语言 Huqariq 语料库收录了 220 小时的多种土著语音频记录,旨在保护濒危语言,可用于开发语音识别、语言识别和语音合成工具,目前收录 4 种土著语,并计划在 2022 年前达到收录 20 种种土著语的目标。