Mar, 2022

利用探索性规划进行自主学习动作模型

TL;DR本文提出了一种新型的探索计划代理,它能够在没有专家跟踪或给定目标的情况下学习行动先决条件和效果,优化探索和行动模型学习,运用新的表示为 Lifted Linked Clauses 和一种新颖的探索行动选择方法,并在探索为中心的视频游戏场景中进行实证评估。