MMMay, 2019

基于知识的不确定性顺序决策制定

TL;DR本文提出一种将 DRL 算法与符号计划相结合的新算法,引入声明性知识来提高其数据效率和可解释性,并通过公开基准的实验分析验证了其子任务的可解释性,结果表明我们的方法在数据效率方面优于现有的最先进方法。