SberQuAD - 俄语阅读理解数据集:描述与分析
本研究介绍了 Stanford Question Answering Dataset (SQuAD),一种包含超过 100,000 个问题的阅读理解数据集,旨在研究回答这些问题所需要的类型推理方式,研究使用依赖和组成树建立了强大的逻辑回归模型,并在数据集上获得了 51.0% 的 F1 分数。
Jun, 2016
文章介绍了 RuBQ,第一个俄语知识库问答(KBQA)数据集,它包括 1,500 个俄语问题、它们的英语机器翻译、SPARQL 查询到维基数据、参考答案和一些包含俄语标签实体的维基数据样本。数据集的创建经历了自动过滤、众包实体链接、自动生成 SPARQL 查询以及后续的审核。
May, 2020
我们介绍了一个众包的波斯语阅读理解数据集,包括 80,000 个问题和答案,其中 25%的问题是具有对抗性无法回答的,该数据集被用于建立波斯语阅读理解和提供基线结果的研究。
Feb, 2022
通过使用强大的数据策划方法,我们翻译了英语问答数据集(SQuAD),解决了低资源语言中无高效问答数据集的问题。我们引入了 MahaSQuAD,这是第一个适用于印度马拉地语的完整 SQuAD 数据集,包含 118,516 个训练样本、11,873 个验证样本和 11,803 个测试样本。另外,我们还提供了一个手动验证的黄金测试集,包含 500 个例子。通过解决上下文和语言细微差异的挑战,我们确保了准确的翻译。此外,由于无法简单地将问答数据集直接转换为任何低资源语言,我们需要一种强大的方法将答案翻译映射到译文段落中的相应部分。因此,为了解决这一挑战,我们还提出了一种通用方法,可以将 SQuAD 翻译成任何低资源语言。因此,在问题回答系统领域,我们提供了一种可扩展的方法,弥合了低资源语言中存在的语言和文化差距。数据集和模型已公开共享于此 https URL。
Apr, 2024
本文提出 Translate Align Retrieve (TAR) 方法,通过将 Stanford Question Answering Dataset(SQuAD)v1.1 自动翻译成西班牙语,创建了大规模的西班牙语 QA training dataset。使用此数据集通过微调 Multilingual-BERT 模型训练了西班牙语 QA 系统,并在 MLQA 和 XQuAD 基准测试上进行了评估,结果表明该方法优于 Multilingual-BERT 基线,达到了新的最高 69.1 F1 分数。
Dec, 2019
本文介绍了一种名为 FQuAD 的法语本地阅读理解数据集,并成功训练出基线模型,通过 F1 得分和准确匹配比率很好地回答了问题。同时,研究人员为追踪法语问答模型的进展提出了排行榜。
Feb, 2020
该研究介绍了韩语问答数据集(KorQuAD),这是一个用于机器阅读理解的大型韩语数据集,有助于自动回答语音机器人和自动化客户支持系统的开发。
Sep, 2019
本研究开发了 Kencorpus Swahili Question Answering Dataset(KenSwQuAD), 这一包含 7,526 个 QA 组合的数据集(每一个包含至少 5 个 QA 组合的文本都被标注了 QA 组合),证明其对机器理解自然语言很有用。
May, 2022
机器阅读理解在医疗问答系统中发挥着重要作用,本研究通过整合专门的医学数据集和创建专用数据集的方法,提高了问答系统的准确性,为临床决策和医学研究的进展做出贡献。通过对 BERT、RoBERTa 和 Tiny RoBERTa 等模型进行微调,显著提高了对医学内容的响应准确性。
Apr, 2024
TriviaQA 是一个具有挑战性的阅读理解数据集,包含超过 650k 个问题 - 答案 - 证据三元组,该数据集需要进行跨句子推理和包含看似复杂、组合式、句法和词汇变化巨大的问题,并提供了两种基线算法:基于特征的分类器和最先进的神经网络,它们在 SQuAD 阅读理解上表现良好,但都无法接近人类表现(23%和 40%与 80%),因此需要进一步的研究。
May, 2017