ACLFeb, 2021

如何在文盲社区建立代表性语料库:发展中国家挑战与缓解策略综述

TL;DR为解决数据驱动 NLP 中文盲社区的不足,本文查明了来自贫困国家乡村社区的不识字人群数据收集可能存在的潜在偏见和道德问题,并提出了一套实用的缓解策略。