Mar, 2020

通过可微归纳逻辑程序设计将关系背景知识纳入强化学习

TL;DR本文提出了一种基于可微分归纳逻辑编程的深度关系强化学习算法,可以从图像中有效地学习关系信息并将环境的状态呈现为一阶逻辑谓词,同时可以将专家背景知识并入学习问题中,展示了该框架在 BoxWorld、GridWorld 以及 Sort-of-CLEVR 数据集等环境中的有效性。