EMNLPApr, 2022

WikiOmnia: 面向全俄罗斯维基百科的生成式问答语料库

TL;DR该研究提出了 WikiOmnia 数据集,该数据集是一个公开的 QA 对和相应俄语维基百科文章摘要部分集合。该数据集通过自动化生成流程组成,可在不同领域(例如新闻文本、小说和社交媒体)中创建 SQuAD 格式的 QA,其结果数据集包括原始数据和经自动验证的清理数据。