AmQA：阿姆哈拉问答数据集

Mar, 2023

AmQA: Amharic Question Answering Dataset

Tilahun Abedissa, Ricardo Usbeck, Yaregal Assabie

TL;DR为了促进阿姆哈拉语 QA (AmQA) 研究，我们提供了第一个阿姆哈拉语 QA (AmQA) 资料集。我们通过众包收集了 2628 个问题 - 答案对，并运行了一个基于 XLMR Large 的基线模型来激发开放域 QA 研究兴趣。最佳性能基线在阅读器 - 检索 QA 和阅读理解设置中分别达到了 69.58 和 71.74 的 F-score。

Abstract

question answering (QA) returns concise answers or answer lists from natural language text given a context document. Many resources go into curating QA datasets to advance robust models' development. There is a surge of

question answering qa datasets amharic amqa dataset xlmr large

发现论文，激发创造

TIGQA：提格里尼亚语的专家标注问答数据集

使用机器翻译将现有数据集转化为 Tigrinya 数据集，构建了 TIGQA 专家注释的教育数据集，通过综合分析展示了 TIGQA 数据集需要单句和多句推理能力，使用最先进的 MRC 方法进行了实验，并与人类表现进行对比，结果强调了对 TIGQA 的进一步研究增强的潜力。

Apr, 2024

AfriQA: 面向非洲语言的跨语言开放式检索问答

AfriQA 是第一个集中于非洲语言的交叉语言问答数据集，包括了 10 种非洲语言的 12,000 多个交叉语言问答样例。该研究表明自动翻译和多语种检索方法的效果不佳，AfriQA 对最先进的问答模型提出了巨大挑战，并期望该数据集能够促进更公平的 QA 技术的发展。

May, 2023

ArabicaQA: 阿拉伯问答系统的综合数据集

本文介绍了 ArabicaQA，这是第一个用于阿拉伯语机器阅读理解和开放域问题回答的大规模数据集，包含了 89095 个可回答和 3701 个无法回答的问题，以及其他标记的开放域问题。同时还介绍了 AraDPR，这是第一个针对阿拉伯文本检索的密集段落检索模型，经过阿拉伯维基百科语料库的训练，专门用于解决阿拉伯文本检索中的独特挑战。此外，我们还对大型语言模型在阿拉伯语问题回答中进行了广泛的基准测试，并对其在阿拉伯语环境中的性能进行了批判性评估。总之，ArabicaQA、AraDPR 和在阿拉伯语问题回答中的语言模型基准测试为阿拉伯语自然语言处理领域带来了重要的进展。数据集和代码对于进一步研究都是公开可访问的。

Mar, 2024

KenSwQuAD-- 用于斯瓦希里低资源语言的问答数据集

本研究开发了 Kencorpus Swahili Question Answering Dataset（KenSwQuAD）, 这一包含 7,526 个 QA 组合的数据集（每一个包含至少 5 个 QA 组合的文本都被标注了 QA 组合），证明其对机器理解自然语言很有用。

May, 2022

走向更加公平的问答系统：需要多少更多的数据？

本研究探讨如何通过自动翻译和排列组合技术将已有的数据资源应用到多语种的问答系统中，并进行深入分析和提出未来数据集开发的建议，以提高多语种问答系统的覆盖面。

May, 2021

UQA: 乌尔都问答语料库

介绍了 UQA，一个用于乌尔都语（Urdu）问答和文本理解的新数据集，通过一种称为 EATS 的技术，将斯坦福问答数据集（SQuAD2.0）的答案段落的翻译上下文中的答案范围进行保留，在两个候选项（Google Translator 和 Seamless M4T）中选择和评估最佳翻译模型，并对 UQA 上的几个最先进的多语言问答模型进行基准测试，其中包括 mBERT，XLM-RoBERTa 和 mT5，报告了有希望的结果。通过展示 EATS 对于创建其他语言和领域的高质量数据集的效果，证明了 UQA 对于开发和测试乌尔都语的多语言 NLP 系统以及增强现有模型的跨语言可迁移性是有价值的。UQA 数据集和代码可在 www.github.com/sameearif/UQA 上公开获取。

May, 2024

面向现实世界的口语方言问答

本文介绍了一个针对多个语言方言创建的语音问答数据集，分析了语音识别错误和方言对问答系统性能的影响，并且研究了不同用户群体的公平性问题。

Sep, 2021

神经网络阿拉伯语问答

本文介绍了一个使用维基百科作为知识来源来解决阿拉伯语开放领域事实问题回答的方法，提出了阿拉伯阅读理解数据集（ARCD），并使用预训练的双向转换器 BERT 构建了 SOQAL 系统来回答问题，实验结果表明其有效性。

Jun, 2019

MLQA：评估跨语言抽取式问答

该研究提出了一个名为 MLQA 的多语言提取式问答（QA）评估基准，旨在推动跨语言 QA 研究。 MLQA 包含 7 种语言的 QA 实例，并使用一种新颖的对齐上下文策略，基于 Wikipedia 文章构建，以此作为现有提取式 QA 数据集的跨语言扩展。

Oct, 2019

JaQuAD: 用于机器阅读理解的日语问答数据集

本文提出了 JaQuAD 数据集，它是一种由人类注释的日语问答数据集，用于非英语语言的 QA 任务的研究。该数据集由 39,696 个问题 - 答案对组成并且基于日本维基百科文章。我们针对基线模型进行微调，测试数据集上的 F1 得分为 78.92％，EM 为 63.38％。

Feb, 2022