May, 2022

KenSwQuAD-- 用于斯瓦希里低资源语言的问答数据集

TL;DR本研究开发了 Kencorpus Swahili Question Answering Dataset(KenSwQuAD), 这一包含 7,526 个 QA 组合的数据集(每一个包含至少 5 个 QA 组合的文本都被标注了 QA 组合),证明其对机器理解自然语言很有用。