透过 DBpedia 的眼睛看维基数据
本文尝试借助异构链接数据和语义 Web 技术,提出了一种新的方案来丰富 Wikidata 知识库,并使用 DBpedia 和 Getty 图像库作为实现案例,结果表明该方法可为 Wikidata 注入数百万条高质量的数据。
Jul, 2022
基于问题回答技术,本研究提出了一个能从网页中提取新事实并推荐给 Wikidata 编辑人员验证的框架,并通过利用 Wikidata 中已有的信息,无需额外学习信号便可训练该框架来提取各种属性和领域的新事实,实验结果表明平均 F1 得分为 84.07,在人类验证之前,有潜力提取数百万条事实,旨在帮助编辑人员的日常任务,完善 Wikidata 知识图谱。
Jan, 2024
本文综述了当前 Wikidata 实体链接数据集的构建及特点,并指出现有实体链接方法仅利用 Wikidata 标签等通用特性,未充分利用其特有的超关系结构,提出应该加入超关系图嵌入和类型信息以提高实体链接质量,并探讨了与 Wikipedia 结合提供更好文本信息的可能性。
Dec, 2021
本文介绍了如何使用一组 “公理模式” 将传统本体论建模与 Wikibase 平台结合起来,以弥合范式差异,以及对历史数据进行使用指南和示例。
May, 2022
本研究提出了一个基于 Wikidata 的大型知识图谱的口语化理解数据集 WDV,以填补当前 KG 口语化数据集在丰富性和紧密耦合性方面存在的空缺,同时通过衡量人类可读程度和足够性等可重复的工作流程评估了信息转化的质量。
May, 2022
描述了超过 10,300 个 Encyclopédie 条目与 Wikidata 识别符的注释,使其与图形连接起来,并考虑了地理和人物实体。
Jun, 2024
本文比较了 Diversity Searcher 使用的两个数据源:DBpedia 和 Wikidata,讨论了这些数据源对文本分析结果的影响,描述了在设计数据分析和其背后的假设以及结果方面所需的许多决策和潜在影响。
Dec, 2022
本研究调查了 Wikidata 中是否包含与现有常识源不同的常识知识,并通过三个指导原则生成了 Wikidata 的常识子图。实验发现,尽管 Wikidata-CS 表示 Wikidata 的一小部分,但它是包含相关常识知识的指示器,可以映射到 15 个 ConceptNet 关系;Wikidata-CS 与其他常识源的重叠很小,需要进行知识集成和质量改进。基于这些发现,我们提出了三个长期改进建议。
Aug, 2020
本文介绍了一种将 Wikidata 语句转换为英文维基百科文章的任务转化为自然语言文本的方法,并且对输出内容进行了句子结构分析,噪声过滤以及基于词嵌入模型的句子构成关系评估。
Oct, 2022