Aug, 2023

Belebele 基准测试:122 种语言变体的平行阅读理解数据集

TL;DR我们提供了 Belebele,这是一个涵盖了 122 种语言的多选机器阅读理解(MRC)数据集。该数据集显著扩展了自然语言理解(NLU)基准的语言覆盖范围,在高、中、低资源语言中评估了文本模型,从而使得对模型性能的直接比较成为可能。通过这个数据集,我们评估了多语言掩码语言模型(MLMs)和大型语言模型(LLMs)的能力,并得出了一些结论。