基于双智能体的知识图谱推理学习

Dec, 2021

基于双智能体的知识图谱推理学习

Learning to Walk with Dual Agents for Knowledge Graph Reasoning

Denghui Zhang, Zixuan Yuan, Hao Liu, Xiaodong Lin, Hui Xiong

TL;DR本文提出了一个双智能体强化学习框架，通过将 GIANT 代理快速搜索集群级路径并为另一个代理 DWARF 提供逐阶段的提示来解决长路径推理挑战，并在几个知识图推理基准测试上取得了更高的准确性和效率。

Abstract

Graph walking based on reinforcement learning (RL) has shown great success in navigating an agent to automatically complete various reasoning tasks over an incomplete →

reinforcement learning knowledge graph reasoning tasks long paths dual-agent framework

发现论文，激发创造

DeepPath: 知识图谱推理的强化学习方法

本文提出了一种基于强化学习的多跳关系路径学习框架，利用知识图谱嵌入、采样方式和奖励函数提高路径推理的精度、多样性和效率，并在 Freebase 和 Never-Ending Language Learning 数据集上展示了其优异性能。

Jul, 2017

采用规则指导的协作智能体学习知识图谱推理

本文介绍了一种名为 RuleGuider 的算法，它通过整合高质量的基于符号的规则，为基于游走的代理提供奖励监督，以提高其性能。在基准数据集上的实验结果表明，RuleGuider 提高了基于游走的模型的性能而不失可解释性。

May, 2020

KG-Agent: 知识图谱复杂推理的高效自主代理框架

本研究旨在通过知识图谱改进大型语言模型 (LLM) 的推理能力，以回答复杂问题。我们提出了一种自主的基于 LLM 的智能体框架 KG-Agent，它允许一个小型 LLM 主动作出决策，直到完成对知识图谱的推理过程。在 KG-Agent 中，我们整合了 LLM、多功能工具箱、基于知识图谱的执行器和知识存储器，并开发了一个迭代机制，自主选择工具，然后更新用于对知识图谱进行推理的记忆。为了保证有效性，我们利用程序语言对知识图谱上的多跳推理过程进行了规范，并合成了基于代码的指令数据集，以对基础 LLM 进行微调。大量实验证明，仅使用 10K 个样本对 LLaMA-7B 进行微调就能在领域内外的数据集上超过使用更大的 LLM 或更多数据的现有方法。我们的代码和数据将公开发布。

Feb, 2024

开放知识图谱推理的协作策略学习

本文提出了一种利用强化学习框架开发的面向缺失事实的多跳图推理和事实提取代理的协同训练方法，以预测知识图谱中缺失的事实，从而提升可解释性推理的效果。

Aug, 2019

基于奖励塑形的多跳知识图谱推理

文中提出了两个方法来解决不完整知识图谱上的多跳推理查询回答中存在的问题，其一是使用预训练的一跳嵌入模型来估算未观察到事实的奖励，其二是使用随机生成的边缘掩码来强制代理探索不同的路径，该方法在多个基准数据集上明显优于现有的基于路径的 KGQA 模型，并且与基于嵌入的模型相当甚至更好。

Aug, 2018

散步并到达答案：利用强化学习在知识库中推理路径

提出了一种名为 MINERVA 的算法，采用神经强化学习方法解决在只知道一个实体的情况下，找到预测路径的困难问题，以实现知识库（KB）的完善，这种方法在多个数据集上均取得了最新成果。

Nov, 2017

知识图谱问答的变分推断

本文介绍了一种基于知识图谱的问答系统，采取了一种新型的深度学习架构和端到端变分学习算法，可以同时处理问题中的噪声和多跳推理，在最新的基准数据集中取得了最优表现。

Sep, 2017

多智能体强化学习中的递归推理图

采用递归推理模型和中央训练 - 分散执行框架的多智能体强化学习算法，能够帮助学习代理更好地合作或竞争，取得了多个多智能体粒子和机器人游戏中的最佳性能。

Mar, 2022

学习在维基百科图上检索推理路径用于问答

介绍了一种基于图形的循环检索方法，学习在 Wikipedia 图形上检索推理路径来回答多跳开放域问答问题。该方法在三个开放域 QA 数据集上实现了最新技术成果，特别是在 HotpotQA 中表现出显著的改进，超过了以前最好的模型 14 个百分点以上。

Nov, 2019

通过奖励塑造技术增强多跳知识图推理

利用强化学习和 BERT 嵌入来改进多跳知识图谱推理的方法，以提高知识图谱推理的准确性和鲁棒性。

Mar, 2024