Nov, 2022

技术干预在低资源语言中的应用:提升贡迪语信息获取能力的经验教训

TL;DR通过技术驱动的数据收集方法,我们创建了超过 60,000 条从印度南部和中部约 2.3 百万部落人口使用的低资源易失语言之一贡迪语到印地语的翻译数据,不仅创建了 26,240 条印地语 - Gondi 语的翻译语料库,还参与了近 850 名社区成员,让 Gondi 语进入互联网领域。