知识库完整性预测

WSDMDec, 2016

Predicting Completeness in Knowledge Bases

Luis Galárraga, Simon Razniewski, Antoine Amarilli, Fabian M. Suchanek

TL;DR本文研究如何利用规则挖掘和多种信号来预测知识库中可能缺失的某些事实，以提高知识库的完整性，并展示完整性预测对事实预测的辅助作用。

Abstract

knowledge bases such as Wikidata, DBpedia, or YAGO contain millions of entities and facts. In some knowledge bases, the correctness of these facts has been evaluated. However, much less is known about their

knowledge bases completeness rule mining fact prediction signals

发现论文，激发创造

面向知识库的需求加权完整性预测

本文提出了 “权重完备性” 的概念，该概念可以评估知识库对其实际使用的完备性。本研究利用实体的类别和使用数据来预测实体之间关系的概率分布，从而检测知识库中的重要空缺并确定未曾收录实体的相关信息。同时，本论文还展示了一个用于测量权重完备性的简单神经网络模型，取得了不错的结果。

Apr, 2018

知识库补全与迁移学习结合

本文提出了一种有效的预训练方法，用于从非结构化文本中提取的事实的规范化和非规范化知识库，通过小数据集上实验证明其相对于已有方法的改进，不依赖于大型预先训练的模型（如 BERT）

Aug, 2021

开放世界知识库中的完整性、召回率和否定性：一项调查

本文介绍了有关知识库的完整性、回溯和否定的表示、提取和推断的方法，以及对应的方法及其工作原理的基本方法，并针对两类受众提出了解决不完备知识库方面的建议。

May, 2023

基于新数据集和方法推断知识库补全的缺失实体类型实例

本文研究知识库完成的问题，聚焦于推断知识库中缺失的实体类型实例，提出了使用现有知识库信息和维基百科的外部信息的知识库完成方法，并通过构建大规模数据集和设计自动评估方法验证了方法的有效性和正确性。

Apr, 2015

实体和关系嵌入模型在知识图谱补全中的调查

本研究是对实体和关系的嵌入模型在知识图谱完善领域的综合调查，总结了标准基准数据集的最新实验结果，并指出了潜在的未来研究方向。

Mar, 2017

长尾实体的开放知识扩充

本文提出了一种全面的知识丰富方法，利用开放 Web 预测缺失属性并推断长尾实体的真实事实来改进知识库，实验结果表明该方法的可行性和优越性。

Feb, 2020

评估语言模型用于知识库补全

本文介绍了一种更具挑战性的基准数据集和方法，用于评估语言模型在无监督知识库补全方面的潜力，并发现了语言模型在补全 Wikidata 中 nativeLanguage、usedLanguage 和 citizenOf 等关系方面表现出强大的泛化能力。

Mar, 2023

通过属性分解从知识库中发现事实

提出了一种新的知识库任务，即从头实体中发现相关事实的问题，并提出了一个新的框架来解决该问题，其中使用自编码器组件和反馈学习组件来实现。实验结果表明，该框架取得了有希望的结果。

Apr, 2019

长尾实体的知识库补全

本文提出了一种基于语言模型的知识库完成方法，针对长尾实体的事实，该方法利用两个不同的语言模型进行候选检索和候选验证和消歧，通过评估我们的方法和不同的基线，引入一个名为 MALT 的基于 Wikidata 的数据集，我们的方法在 F1 中优于所有基线，尤其是在召回率方面有很大提升。

Jun, 2023

逐步增强的知识图谱补全

在这篇论文中，我们研究了与真实世界建设场景相关的三个重要过程：验证过程，挖掘过程和训练过程，并通过整合这三个过程引入了渐进式知识图谱完成（PKGC）任务，以模拟在真实世界场景中逐步完善知识图谱的过程。此外，为了加快 PKGC 处理，我们提出了两个加速模块：优化的 Top-k 算法和语义有效性过滤器，这些模块显著提高了挖掘过程的效率。我们的实验证明链接预测的性能不能准确反映 PKGC 的性能，更深入的分析揭示了影响结果的关键因素，并为未来的研究提供了潜在的方向。

Apr, 2024