使用 DeepDive 进行增量知识库构建
DeepKE 是一款开源的知识提取工具,支持复杂的低资源、文档级别和多模态场景。它实现了各种信息提取任务,包括命名实体识别、关系提取和属性提取。
Jan, 2022
本文提出了一种从自然语言数据中自动构建概率性知识图谱的初始原型 ——Maritime DeepDive,利用该工具从海盗事件中提取概率事件,该工具的准确性和信心得到了验证。
May, 2023
本研究提出了一种名为 Fonduer 的机器学习 KBC 系统,它通过新的数据模型和深度学习模型,自动捕捉不同模态信息的特征,并利用 Fonduer 的编程模型,将领域专业知识转化为有效的监督信号,以提高知识库构建的效率和质量。与专家编辑的公共知识库相比,Fonduer 的质量平均提高了 41 个 F1 点,并且在某些情况下产生了 1.87 倍的正确条目。
Mar, 2017
提出了一种基于知识进化的训练方法,它通过将深度网络分成适配假设和重置假设来迭代进化知识,能够在相对较小的数据集上提高性能、学习较瘦的网络并减少推理成本,达到 21% 的绝对性能提升和 73% 的相对推理成本降低。
Mar, 2021
本文介绍了一个基于查询的多模态知识库完成系统,其通过融合非结构化和结构化信息的多模态知识图,提出了一种多模态路径融合算法来排列候选答案,并利用查询驱动技术提高了系统效率,以证明该系统的高效性和有效性。
Dec, 2022
本文论述如何为知识图谱的建设和持续更新提供通用管道,谈论了高质量 KG 的必需步骤,包括元数据管理,本体开发和质量保证,并对 KG 建设工具和策略的现状进行评估和总结,并提出了需要进一步研究和改进的领域。
Feb, 2023
我们描述了一个可微分的神经模块 DrKIT,它可以处理复杂的多跳问题,使用类似知识库的语料库,使用 TFIDF 指数和最大内积搜索技术,在每个步骤中都可以对实体的提及进行上下文表示,并介绍了用于上下文表示编码器的预训练方案。结果表明,DrKIT 在 MetaQA 数据集中的 3 跳问题上的准确性提高了 9 个百分点,在 HotpotQA 上,DrKIT 比基于 BERT 的重新排序方法提高了 10%。此外,DrKIT 非常高效。
Feb, 2020
本文针对现代深度学习神经网络模型需要大量手动标注数据以及从大量文本数据中构建领域特定知识图谱的困难问题,提出一个将知识图谱自适应和重新学习应用于不需要手动注释训练数据的领域适应性构建的综合框架,并引入了一种新的迭代训练策略来促进领域特定命名实体和三元组的发现和抽取,实验结果表明,该框架可以有效执行领域适应和构建知识图谱的任务。
Nov, 2022
本研究提出了一种知识库框架,通过构建一个大规模的多模态知识库来回答各种视觉查询,同时保持灵活性和可扩展性。研究表明所提系统能够取得有竞争力的结果,并能够应对更丰富的视觉查询。
Jul, 2015
本文提出了一种基于双向学习的无监督文本到路径和路径到文本转化方法,研究了弱监督对模型性能的影响,并提出了一种适用于生成模型的 Commonsense KB 完成度量。实验结果表明,该方法与现有的基线方法相比,效果明显提高,是实现自动 KB 构建 / 扩展和 KB 转化的可行方法之一。
Oct, 2020