NorQuAD:挪威问答数据集

May, 2023

NorQuAD: Norwegian Question Answering Dataset

Sardana Ivanova, Fredrik Aas Andreassen, Matias Jentoft, Sondre Wold, Lilja Øvrelid

TL;DR本文介绍了NorQuAD数据集，这是第一个用于机器阅读理解的挪威问答数据集，包含4,752个手动创建的问题和答案对。我们详细介绍了数据收集过程，并陈述了数据集的统计信息。我们还对数据集进行了多语言和挪威单语言语言模型的基准测试，并将它们与人类表现进行了比较。该数据集将免费提供。

Abstract

In this paper we present NorQuAD: the first norwegian question answering dataset for →