May, 2023

NorQuAD:挪威问答数据集

TL;DR本文介绍了NorQuAD数据集,这是第一个用于机器阅读理解的挪威问答数据集,包含4,752个手动创建的问题和答案对。我们详细介绍了数据收集过程,并陈述了数据集的统计信息。我们还对数据集进行了多语言和挪威单语言语言模型的基准测试,并将它们与人类表现进行了比较。该数据集将免费提供。