SberQuAD - 俄语阅读理解数据集：描述与分析

Dec, 2019

SberQuAD - 俄语阅读理解数据集：描述与分析

SberQuAD -- Russian Reading Comprehension Dataset: Description and Analysis

PDF

Pavel Efimov, Andrey Chertok, Leonid Boytsov, Pavel Braslavski

TL;DR介绍了 SberQuAD 这一俄语数据集资源，提供了评估、分析和实验结果等基础性研究。

Abstract

sberquad -- a large scale analog of stanford squad in the russian language - is a valuable →

sberquad stanford squad russian language resource experimental results

发现论文，激发创造

SQuAD: 文本机器理解 10 万 + 问题

本研究介绍了 Stanford Question Answering Dataset (SQuAD)，一种包含超过 100,000 个问题的阅读理解数据集，旨在研究回答这些问题所需要的类型推理方式，研究使用依赖和组成树建立了强大的逻辑回归模型，并在数据集上获得了 51.0% 的 F1 分数。

Jun, 2016

RuBQ: 一个用于维基数据问答的俄语数据集

文章介绍了 RuBQ，第一个俄语知识库问答（KBQA）数据集，它包括 1,500 个俄语问题、它们的英语机器翻译、SPARQL 查询到维基数据、参考答案和一些包含俄语标签实体的维基数据样本。数据集的创建经历了自动过滤、众包实体链接、自动生成 SPARQL 查询以及后续的审核。

May, 2020

PQuAD：一个波斯语问答数据集

我们介绍了一个众包的波斯语阅读理解数据集，包括 80,000 个问题和答案，其中 25％的问题是具有对抗性无法回答的，该数据集被用于建立波斯语阅读理解和提供基线结果的研究。

Feb, 2022

MahaSQuAD：马拉地语问答中的语言桥梁

通过使用强大的数据策划方法，我们翻译了英语问答数据集（SQuAD），解决了低资源语言中无高效问答数据集的问题。我们引入了 MahaSQuAD，这是第一个适用于印度马拉地语的完整 SQuAD 数据集，包含 118,516 个训练样本、11,873 个验证样本和 11,803 个测试样本。另外，我们还提供了一个手动验证的黄金测试集，包含 500 个例子。通过解决上下文和语言细微差异的挑战，我们确保了准确的翻译。此外，由于无法简单地将问答数据集直接转换为任何低资源语言，我们需要一种强大的方法将答案翻译映射到译文段落中的相应部分。因此，为了解决这一挑战，我们还提出了一种通用方法，可以将 SQuAD 翻译成任何低资源语言。因此，在问题回答系统领域，我们提供了一种可扩展的方法，弥合了低资源语言中存在的语言和文化差距。数据集和模型已公开共享于此 https URL。

Apr, 2024

面向多语言问答的 SQuAD 数据集自动西班牙语翻译

本文提出 Translate Align Retrieve (TAR) 方法，通过将 Stanford Question Answering Dataset（SQuAD）v1.1 自动翻译成西班牙语，创建了大规模的西班牙语 QA training dataset。使用此数据集通过微调 Multilingual-BERT 模型训练了西班牙语 QA 系统，并在 MLQA 和 XQuAD 基准测试上进行了评估，结果表明该方法优于 Multilingual-BERT 基线，达到了新的最高 69.1 F1 分数。

Dec, 2019

FQuAD: 法语问答数据集

本文介绍了一种名为 FQuAD 的法语本地阅读理解数据集，并成功训练出基线模型，通过 F1 得分和准确匹配比率很好地回答了问题。同时，研究人员为追踪法语问答模型的进展提出了排行榜。

Feb, 2020

KorQuAD1.0：针对机器阅读理解的韩文问答数据集

该研究介绍了韩语问答数据集（KorQuAD），这是一个用于机器阅读理解的大型韩语数据集，有助于自动回答语音机器人和自动化客户支持系统的开发。

Sep, 2019

KenSwQuAD-- 用于斯瓦希里低资源语言的问答数据集

本研究开发了 Kencorpus Swahili Question Answering Dataset（KenSwQuAD）, 这一包含 7,526 个 QA 组合的数据集（每一个包含至少 5 个 QA 组合的文本都被标注了 QA 组合），证明其对机器理解自然语言很有用。

May, 2022

emrQA-msquad: 使用 SQuAD V2.0 框架构建的医疗数据集，丰富了 emrQA 医疗信息

机器阅读理解在医疗问答系统中发挥着重要作用，本研究通过整合专门的医学数据集和创建专用数据集的方法，提高了问答系统的准确性，为临床决策和医学研究的进展做出贡献。通过对 BERT、RoBERTa 和 Tiny RoBERTa 等模型进行微调，显著提高了对医学内容的响应准确性。

Apr, 2024

TriviaQA：一个大规模远程监督的挑战性阅读理解数据集

TriviaQA 是一个具有挑战性的阅读理解数据集，包含超过 650k 个问题 - 答案 - 证据三元组，该数据集需要进行跨句子推理和包含看似复杂、组合式、句法和词汇变化巨大的问题，并提供了两种基线算法：基于特征的分类器和最先进的神经网络，它们在 SQuAD 阅读理解上表现良好，但都无法接近人类表现（23％和 40％与 80％），因此需要进一步的研究。

May, 2017