May, 2023

NorQuAD: 挪威问答数据集

TL;DR本文介绍了 NorQuAD 数据集,这是第一个用于机器阅读理解的挪威问答数据集,包含 4,752 个手动创建的问题和答案对。我们详细介绍了数据收集过程,并陈述了数据集的统计信息。我们还对数据集进行了多语言和挪威单语言语言模型的基准测试,并将它们与人类表现进行了比较。该数据集将免费提供。