从奖励中学习关系规则

Mar, 2022

Learning Relational Rules from Rewards

Guillermo Puebla, Leonidas A. A. Doumas

TL;DR本文通过关系强化学习来理解认知系统如何选择在特定任务中有用的特征关系以及如何利用这些表达来有效地与环境交互。我们使用建立在 RRL 中开发的函数逼近器的简单模型来展示我们的方法的潜力，并在需要考虑日益增多的潜在关系的三个 Atari 游戏中进行了训练和测试。在每个游戏中，我们的模型能够选择适当的关系表达式，并逐步建立关系策略。我们探讨了本模型与关系和类比推理模型之间的关系，以及其限制和未来的研究方向。

Abstract

Humans perceive the world in terms of objects and relations between them. In fact, for any given pair of objects, there is a myriad of relations that apply to them. How does the cognitive system learn which relations are useful to characterize the task at hand? And how can it use these representations to build a relational policy to interact effectively with

relational reinforcement learning symbolic machine learning relational policy learning atari games analogical reasoning

发现论文，激发创造

关系深度强化学习

通过结构化感知和关系推理的方法，使用自我注意力来进行实体之间关系的迭代推理以及指导无模型策略的建立，提高了强化学习的效率、泛化能力和可解释性，并在 Box-World 任务和 StarCraft II Learning Environment 等方面取得了一定的进展。

Jun, 2018

基于图神经网络的符号关系深度强化学习

通过图神经网络和自回归策略分解，构建了一个深度强化学习框架，在多样化场景下表现出了出色的竞争能力和卓越的零 - shot 泛化能力.

Sep, 2020

通过可微归纳逻辑程序设计将关系背景知识纳入强化学习

本文提出了一种基于可微分归纳逻辑编程的深度关系强化学习算法，可以从图像中有效地学习关系信息并将环境的状态呈现为一阶逻辑谓词，同时可以将专家背景知识并入学习问题中，展示了该框架在 BoxWorld、GridWorld 以及 Sort-of-CLEVR 数据集等环境中的有效性。

Mar, 2020

深度可解释关系强化学习：神经符号方法

提出了一种新的框架 Deep Explainable Relational Reinforcement Learning (DERRL)，它结合了神经网络和符号世界的优势来提取可解释的策略。通过在倒计时游戏、积木世界、网格世界和交通等不同环境中的实验证明，DERRL 可以适用于不同的配置和情境，从而具有通用性。

Apr, 2023

符号问题上通用强化学习的关系抽象

本文介绍了一种新的强化学习方法，利用关系抽象和深度学习，学习符号状态空间中可推广的 Q 函数，并能在零阶转移下转移到不同的相关问题，实现对大规模问题的有效知识迁移。

Apr, 2022

基于关系强化学习实现实用的多物体操作

本文介绍了使用基于图形的关系结构从简单的任务中学习并实现复杂的机器人操作任务，使用了强化学习方法并在喂入少量数据的情况下超越现有的最先进方法，同时也实现了零样本泛化。

Dec, 2019

知识表示与推理的强化学习：简要综述

该文综述了利用知识表示与推理方法在强化学习中更抽象表现和更有效学习的领域中取得的进展和应用，并讨论了未来在此领域中需要解决的挑战和可能的方向。

Apr, 2023

因果透镜下的可解释强化学习

本文使用因果关系模型来推导强化学习器的行为的因果解释，并通过对一项实验的研究结果表明，基于因果模型的解释在任务预测、解释满意度和信任方面表现更好。

May, 2019

使用加强和循环关系推理进行规则发现

本文介绍了 R5，一种基于强化学习的关系推理框架，可以在关系图数据上推理，从观察结果中明确挖掘成分逻辑规则，具有强大的系统性和稳健性，实验结果表明 R5 在关系预测任务中优于各种基于嵌入和规则归纳的基线，并在发现基本事实规则时达到高召回率。

May, 2022

一种基于强化学习的关系抽取分层框架

本文提出一种新的范例来处理关系提取问题，将相关实体作为一个关系的参数，并应用分层强化学习框架来增强实体提取和关系类型之间的交互。通过将整个提取过程分解成关系侦测和实体提取的两级 RL 策略层次结构，以处理重叠重复的关系，并在公共数据集上进行了评估，结果表明，它比现有的方法具有更好的性能，并可以更强大地提取重叠关系。

Nov, 2018