面向知识图谱的开放领域知识提取

Oct, 2023

面向知识图谱的开放领域知识提取

Open Domain Knowledge Extraction for Knowledge Graphs

Kun Qian, Anton Belyi, Fei Wu, Samira Khorshidi, Azadeh Nikfarjam...

TL;DR通过 ODKE，我们介绍了一个可扩展的框架，用于从开放网络规模化地获取高质量的实体和事实，并分享在构建和部署行业级开放领域知识图谱时所学到的经验教训。

Abstract

The quality of a knowledge graph directly impacts the quality of downstream applications (e.g. the number of answerable questions using the graph). One ongoing challenge when building a knowledge graph is to ensu

knowledge graph odke entities facts open web

发现论文，激发创造

DeepKE：基于深度学习的知识抽取工具包，用于知识库填充

DeepKE 是一款开源的知识提取工具，支持复杂的低资源、文档级别和多模态场景。它实现了各种信息提取任务，包括命名实体识别、关系提取和属性提取。

Jan, 2022

将表面事实与大规模知识图谱相关联

通过提出一个新的基准测试，该研究论文旨在解决通过评估协议以考量系统的能力，从而能在更细粒度的三元槽级别上测量事实链接性能，同时测量一个系统是否能识别到表面形式在现有知识图谱中没有匹配项。研究还表明，与准确链接到现有实体相比，检测出现有知识图谱中不存在的实体和谓词更加困难，因此需要更多的研究努力来解决这个难题。

Oct, 2023

LOKE：基于链接开放知识提取的自动知识图谱构建

通过对 Wikidata 知识图谱使用 GPT 模型和 prompt engineering 的方法，我们研究了一个叫做 Linked Open Knowledge Extractor (LOKE) 的方法去解决 Open Information Extraction (Open IE) 存在的问题，发现 LOKE-GPT 在 Knowledge Graph Construction (KGC) 任务中比 AllenAI 的 OpenIE 4 实现效果更好。

Nov, 2023

构建和服务大型开放领域知识图谱

本文介绍了基于领域知识图谱的 Saga 平台，包括训练知识图谱嵌入和创建语义注释服务，以及使用注释 Web 文档来驱动开放领域知识抽取。同时，我们还描述了构建和处理个人知识的平台适应。

May, 2023

OpenKI：结合开放信息抽取、知识库和关系推理的方法

本文提出了 OpenKI 模型，通过对 OpenIE 三元组和 Knowledge Bases（KB）的整合来处理 OpenIE 的稀疏性。该模型通过进行实例级别推理来处理未知实体，并借助聚合和关注机制在关系推理中利用其邻域中的信息。实验结果表明，该方法不仅显着提高了现有 OpenIE 提取的准确率，而且还提高了面向半结构化数据的 OpenIE 表现。

Apr, 2019

OEKG: 开放式活动知识图谱

本文介绍了开放事件知识图谱（OEKG），它是一个多语言、事件中心、时间性的知识图谱，由来自多个应用领域的七个不同的数据集组成，包括问答、实体推荐和命名实体识别。这些数据集通过一个易于使用和稳定的管道集成，通过与事件中心的知识图 EventKG 链接，描述了它们的公共模式，并在三个用例中演示了 OEKG 的用法：类型特定的图像检索、基于知识图谱和新闻文章的混合问答以及语言特定的事件推荐。 OEKG 及其查询端点是公开可用的。

Feb, 2023

语言模型以外的开放领域网页关键词提取

本文研究了针对真实情况下的关键词提取，其中文档来自不同领域，内容质量变化巨大。我们精心编排并发布了 OpenKP，一个大规模的开放领域关键字提取数据集，近十万个网络文档和专家关键字注释。我们开发了一种名为 BLING-KPE 的神经关键词提取模型，它通过文档的视觉呈现和来自搜索查询的弱监督超越了语言理解，以处理域和内容质量的变化。在 OpenKP 上的实验结果证实了 BLING-KPE 和其神经结构、视觉特征和搜索日志弱监督的效果。与特定领域相比，从开放领域数据中学习的零 - shot 评估表明了其改进的泛化能力。

Nov, 2019

知识图谱补全模型的开放环境扩展

提出了一种新颖的嵌入式知识图谱完整模型扩展，使其能够执行开放世界链接预测，该模型结合从文字语料库中学习的词嵌入和从知识图谱中学习的常规链接预测模型，通过独立训练这两个模型并进行变换，将实体名称和描述的嵌入映射到基于图的嵌入空间中，实验结果表明我们的方法在多个数据集上都取得了有竞争力的效果且无需对图和文本进行联合训练。

Jun, 2019

知识图谱扩展 —— 通过实体类型识别

本文提出了一种基于实体类型识别的知识图谱扩展框架，通过对不同知识图谱的模式和实体进行对齐，提高了扩展的性能，从而实现高质量的知识提取。通过定量实验和案例研究，全面展示了所提出的扩展框架及其功能的可行性和有效性。

May, 2024

通过探索知识图谱进行实体描述生成

本文介绍了一个大规模、有挑战性的数据集，以促进知识图谱到文本分类的实际场景研究，同时提出了一种多图结构和聚合方法，以更全面地代表原始图信息，并成功解决信息丢失和参数爆炸的问题。

Apr, 2020