知识库完整性预测
本文提出了 “权重完备性” 的概念,该概念可以评估知识库对其实际使用的完备性。本研究利用实体的类别和使用数据来预测实体之间关系的概率分布,从而检测知识库中的重要空缺并确定未曾收录实体的相关信息。同时,本论文还展示了一个用于测量权重完备性的简单神经网络模型,取得了不错的结果。
Apr, 2018
本文提出了一种有效的预训练方法,用于从非结构化文本中提取的事实的规范化和非规范化知识库,通过小数据集上实验证明其相对于已有方法的改进,不依赖于大型预先训练的模型(如 BERT)
Aug, 2021
本文介绍了有关知识库的完整性、回溯和否定的表示、提取和推断的方法,以及对应的方法及其工作原理的基本方法,并针对两类受众提出了解决不完备知识库方面的建议。
May, 2023
本文研究知识库完成的问题,聚焦于推断知识库中缺失的实体类型实例,提出了使用现有知识库信息和维基百科的外部信息的知识库完成方法,并通过构建大规模数据集和设计自动评估方法验证了方法的有效性和正确性。
Apr, 2015
本文介绍了一种更具挑战性的基准数据集和方法,用于评估语言模型在无监督知识库补全方面的潜力,并发现了语言模型在补全 Wikidata 中 nativeLanguage、usedLanguage 和 citizenOf 等关系方面表现出强大的泛化能力。
Mar, 2023
提出了一种新的知识库任务,即从头实体中发现相关事实的问题,并提出了一个新的框架来解决该问题,其中使用自编码器组件和反馈学习组件来实现。实验结果表明,该框架取得了有希望的结果。
Apr, 2019
本文提出了一种基于语言模型的知识库完成方法,针对长尾实体的事实,该方法利用两个不同的语言模型进行候选检索和候选验证和消歧,通过评估我们的方法和不同的基线,引入一个名为 MALT 的基于 Wikidata 的数据集,我们的方法在 F1 中优于所有基线,尤其是在召回率方面有很大提升。
Jun, 2023
在这篇论文中,我们研究了与真实世界建设场景相关的三个重要过程:验证过程,挖掘过程和训练过程,并通过整合这三个过程引入了渐进式知识图谱完成(PKGC)任务,以模拟在真实世界场景中逐步完善知识图谱的过程。此外,为了加快 PKGC 处理,我们提出了两个加速模块:优化的 Top-k 算法和语义有效性过滤器,这些模块显著提高了挖掘过程的效率。我们的实验证明链接预测的性能不能准确反映 PKGC 的性能,更深入的分析揭示了影响结果的关键因素,并为未来的研究提供了潜在的方向。
Apr, 2024