使用 DeepDive 进行增量知识库构建

Feb, 2015

Incremental Knowledge Base Construction Using DeepDive

Jaeho Shin, Sen Wu, Feiran Wang, Christopher De Sa, Ce Zhang...

TL;DRDeepDive 是一个结合数据库和机器学习思想来帮助开发 KBC 系统的系统，通过提出两种增量推理的方法，基于采样和变分技术，解决了 KBC 迭代过程中效率低的问题，并通过评估表明其可以加速 KBC 推理任务两个数量级而对质量几乎没有影响。

Abstract

Populating a database with unstructured information is a long-standing problem in industry and research that encompasses problems of extraction, cleaning, and integration. Recent names used for this problem include dealing with dark data and →

knowledge base construction deep learning database incremental inference optimization

发现论文，激发创造

DeepKE：基于深度学习的知识抽取工具包，用于知识库填充

DeepKE 是一款开源的知识提取工具，支持复杂的低资源、文档级别和多模态场景。它实现了各种信息提取任务，包括命名实体识别、关系提取和属性提取。

Jan, 2022

面向海事领域概率知识图谱自动建设

本文提出了一种从自然语言数据中自动构建概率性知识图谱的初始原型 ——Maritime DeepDive，利用该工具从海盗事件中提取概率事件，该工具的准确性和信心得到了验证。

May, 2023

Fonduer：从丰富格式化数据中构建知识库

本研究提出了一种名为 Fonduer 的机器学习 KBC 系统，它通过新的数据模型和深度学习模型，自动捕捉不同模态信息的特征，并利用 Fonduer 的编程模型，将领域专业知识转化为有效的监督信号，以提高知识库构建的效率和质量。与专家编辑的公共知识库相比，Fonduer 的质量平均提高了 41 个 F1 点，并且在某些情况下产生了 1.87 倍的正确条目。

Mar, 2017

神经网络中的知识演化

提出了一种基于知识进化的训练方法，它通过将深度网络分成适配假设和重置假设来迭代进化知识，能够在相对较小的数据集上提高性能、学习较瘦的网络并减少推理成本，达到 21% 的绝对性能提升和 73% 的相对推理成本降低。

Mar, 2021

基于查询的多模式路径融合的多模式知识图谱完成

本文介绍了一个基于查询的多模态知识库完成系统，其通过融合非结构化和结构化信息的多模态知识图，提出了一种多模态路径融合算法来排列候选答案，并利用查询驱动技术提高了系统效率，以证明该系统的高效性和有效性。

Dec, 2022

知识图谱的构建：现状与挑战

本文论述如何为知识图谱的建设和持续更新提供通用管道，谈论了高质量 KG 的必需步骤，包括元数据管理，本体开发和质量保证，并对 KG 建设工具和策略的现状进行评估和总结，并提出了需要进一步研究和改进的领域。

Feb, 2023

虚拟知识库上的可微推理

我们描述了一个可微分的神经模块 DrKIT，它可以处理复杂的多跳问题，使用类似知识库的语料库，使用 TFIDF 指数和最大内积搜索技术，在每个步骤中都可以对实体的提及进行上下文表示，并介绍了用于上下文表示编码器的预训练方案。结果表明，DrKIT 在 MetaQA 数据集中的 3 跳问题上的准确性提高了 9 个百分点，在 HotpotQA 上，DrKIT 比基于 BERT 的重新排序方法提高了 10％。此外，DrKIT 非常高效。

Feb, 2020

基于远程监督迭代训练的粗到细的知识图谱领域适应

本文针对现代深度学习神经网络模型需要大量手动标注数据以及从大量文本数据中构建领域特定知识图谱的困难问题，提出一个将知识图谱自适应和重新学习应用于不需要手动注释训练数据的领域适应性构建的综合框架，并引入了一种新的迭代训练策略来促进领域特定命名实体和三元组的发现和抽取，实验结果表明，该框架可以有效执行领域适应和构建知识图谱的任务。

Nov, 2022

构建一个大规模的多模态知识库系统，以回答视觉查询

本研究提出了一种知识库框架，通过构建一个大规模的多模态知识库来回答各种视觉查询，同时保持灵活性和可扩展性。研究表明所提系统能够取得有竞争力的结果，并能够应对更丰富的视觉查询。

Jul, 2015

DualTKB: 文本与知识库之间的双重学习桥梁

本文提出了一种基于双向学习的无监督文本到路径和路径到文本转化方法，研究了弱监督对模型性能的影响，并提出了一种适用于生成模型的 Commonsense KB 完成度量。实验结果表明，该方法与现有的基线方法相比，效果明显提高，是实现自动 KB 构建 / 扩展和 KB 转化的可行方法之一。

Oct, 2020