Jul, 2021

WikiGraphs:一组维基百科文本 - 知识图谱配对数据集

TL;DR我们提供了一个新的数据集 WikiGraphs,其中包括每篇维基百科文章和一个知识图,以促进条件文本生成、图形生成和图形表示学习的研究。通过在建立 WikiText-103 基准的每个维基百科文章上与 Freebase 知识图中的一个子图配对,我们的新数据集具有显着的规模,可以轻松评估其他最先进的文本生成模型。我们在数据集上展示并比较了基线图神经网络和变压器模型的 3 种任务结果:图形 -> 文本生成、图形 -> 文本检索和文本 -> 图形检索。文中指出,更好的条件图形可以提高生成和检索的质量,但还有很大的改进空间。