Jul, 2020

MKQA:面向多语言开放域问题回答的语言多样性基准测试

TL;DR研究跨语言建模的进展取决于具有挑战性、真实性和多样性的评估集。本文提出了一种开放领域的问题回答评估集 “Multilingual Knowledge Questions and Answers”(MKQA),包括 10k 个问题 - 答案对,跨越 26 种语言(总计 260k 个问题 - 答案对)。结果表明,即使在英语中,这个数据集也具有挑战性,尤其是在低资源语言中。