透过 DBpedia 的眼睛看维基数据

Jul, 2015

Wikidata through the Eyes of DBpedia

Ali Ismayilov, Dimitris Kontokostas, Sören Auer, Jens Lehmann, Sebastian Hellmann

TL;DR介绍了如何将 Wikidata 融入 DBpedia 生态系统并描述了这一数据集的结构和转换过程。

Abstract

dbpedia is one of the first and most prominent nodes of the linked open data cloud. It provides structured data for more than 100 Wikipedia language editions as well as Wikimedia Commons, has a mature ontology an

dbpedia linked open data wikidata structured information conversion process

发现论文，激发创造

使用链接开放数据丰富维基数据

本文尝试借助异构链接数据和语义 Web 技术，提出了一种新的方案来丰富 Wikidata 知识库，并使用 DBpedia 和 Getty 图像库作为实现案例，结果表明该方法可为 Wikidata 注入数百万条高质量的数据。

Jul, 2022

利用 Wikidata 作为 Web 抽取的种子

基于问题回答技术，本研究提出了一个能从网页中提取新事实并推荐给 Wikidata 编辑人员验证的框架，并通过利用 Wikidata 中已有的信息，无需额外学习信号便可训练该框架来提取各种属性和领域的新事实，实验结果表明平均 F1 得分为 84.07，在人类验证之前，有潜力提取数百万条事实，旨在帮助编辑人员的日常任务，完善 Wikidata 知识图谱。

Jan, 2024

维基数据上英语实体链接调查

本文综述了当前 Wikidata 实体链接数据集的构建及特点，并指出现有实体链接方法仅利用 Wikidata 标签等通用特性，未充分利用其特有的超关系结构，提出应该加入超关系图嵌入和类型信息以提高实体链接质量，并探讨了与 Wikipedia 结合提供更好文本信息的可能性。

Dec, 2021

促进 Wikibase 集成的本体设计 -- 以历史数据为例

本文介绍了如何使用一组 “公理模式” 将传统本体论建模与 Wikibase 平台结合起来，以弥合范式差异，以及对历史数据进行使用指南和示例。

May, 2022

从维基数据构建广泛数据口语化数据集 WDV

本研究提出了一个基于 Wikidata 的大型知识图谱的口语化理解数据集 WDV，以填补当前 KG 口语化数据集在丰富性和紧密耦合性方面存在的空缺，同时通过衡量人类可读程度和足够性等可重复的工作流程评估了信息转化的质量。

May, 2022

发现维基数据中的意向知识

该研究应用正式概念分析方法提取出源于 Wikidata 的易于理解的关联性，以辅助知识图谱的编辑和维护。

Feb, 2019

将迪德罗的《百科全书》中的命名实体链接到维基数据

描述了超过 10,300 个 Encyclopédie 条目与 Wikidata 识别符的注释，使其与图形连接起来，并考虑了地理和人物实体。

Jun, 2024

DBpedia 和 Wikidata 中的政治代表性偏见对下游处理的挑战

本文比较了 Diversity Searcher 使用的两个数据源：DBpedia 和 Wikidata，讨论了这些数据源对文本分析结果的影响，描述了在设计数据分析和其背后的假设以及结果方面所需的许多决策和潜在影响。

Dec, 2022

Wikidata 中的常识知识

本研究调查了 Wikidata 中是否包含与现有常识源不同的常识知识，并通过三个指导原则生成了 Wikidata 的常识子图。实验发现，尽管 Wikidata-CS 表示 Wikidata 的一小部分，但它是包含相关常识知识的指示器，可以映射到 15 个 ConceptNet 关系；Wikidata-CS 与其他常识源的重叠很小，需要进行知识集成和质量改进。基于这些发现，我们提出了三个长期改进建议。

Aug, 2020

任务的映射过程：从维基百科中的 Wikidata 语句到文本句子的转换

本文介绍了一种将 Wikidata 语句转换为英文维基百科文章的任务转化为自然语言文本的方法，并且对输出内容进行了句子结构分析，噪声过滤以及基于词嵌入模型的句子构成关系评估。

Oct, 2022