ACLJun, 2024

mCSQA: 采用语言模型和人类统一创建策略的多语言常识推理数据集

TL;DR通过语言模型的构建过程,使用 LM 生成问题 / 答案、改进答案和验证 QA,然后减少人工验证的工作量,我们提出了 Multilingual CommonsenseQA(mCSQA),这是一个用于评估多语言 LM 的跨语言语言传递能力的基准数据集。实验结果表明,多语言 LM 在处理容易解决的问题时具有较高的语言传递能力,但处理需要深入知识或常识的问题时传递能力较低。这凸显了对语言特定数据集进行评估和训练的必要性,最后,我们的方法证明了多语言 LM 能够创建包含语言特定知识的 QA,与手动创建相比,显著降低了数据集创建成本。