基于双智能体的知识图谱推理学习
本文提出了一种基于强化学习的多跳关系路径学习框架,利用知识图谱嵌入、采样方式和奖励函数提高路径推理的精度、多样性和效率,并在 Freebase 和 Never-Ending Language Learning 数据集上展示了其优异性能。
Jul, 2017
本文介绍了一种名为 RuleGuider 的算法,它通过整合高质量的基于符号的规则,为基于游走的代理提供奖励监督,以提高其性能。在基准数据集上的实验结果表明,RuleGuider 提高了基于游走的模型的性能而不失可解释性。
May, 2020
本研究旨在通过知识图谱改进大型语言模型 (LLM) 的推理能力,以回答复杂问题。我们提出了一种自主的基于 LLM 的智能体框架 KG-Agent,它允许一个小型 LLM 主动作出决策,直到完成对知识图谱的推理过程。在 KG-Agent 中,我们整合了 LLM、多功能工具箱、基于知识图谱的执行器和知识存储器,并开发了一个迭代机制,自主选择工具,然后更新用于对知识图谱进行推理的记忆。为了保证有效性,我们利用程序语言对知识图谱上的多跳推理过程进行了规范,并合成了基于代码的指令数据集,以对基础 LLM 进行微调。大量实验证明,仅使用 10K 个样本对 LLaMA-7B 进行微调就能在领域内外的数据集上超过使用更大的 LLM 或更多数据的现有方法。我们的代码和数据将公开发布。
Feb, 2024
文中提出了两个方法来解决不完整知识图谱上的多跳推理查询回答中存在的问题,其一是使用预训练的一跳嵌入模型来估算未观察到事实的奖励,其二是使用随机生成的边缘掩码来强制代理探索不同的路径,该方法在多个基准数据集上明显优于现有的基于路径的 KGQA 模型,并且与基于嵌入的模型相当甚至更好。
Aug, 2018
提出了一种名为 MINERVA 的算法,采用神经强化学习方法解决在只知道一个实体的情况下,找到预测路径的困难问题,以实现知识库(KB)的完善,这种方法在多个数据集上均取得了最新成果。
Nov, 2017
本文介绍了一种基于知识图谱的问答系统,采取了一种新型的深度学习架构和端到端变分学习算法,可以同时处理问题中的噪声和多跳推理,在最新的基准数据集中取得了最优表现。
Sep, 2017
介绍了一种基于图形的循环检索方法,学习在 Wikipedia 图形上检索推理路径来回答多跳开放域问答问题。该方法在三个开放域 QA 数据集上实现了最新技术成果,特别是在 HotpotQA 中表现出显著的改进,超过了以前最好的模型 14 个百分点以上。
Nov, 2019