Oct, 2018

SDRL:利用符号计划的可解释且数据高效的深度强化学习

TL;DR该研究提出了一种符号深度强化学习(SDRL)框架,该框架通过引入符号规划来实现任务层面的可解释性,并运用计划器 - 控制器 - 元控制器架构进行子任务调度、数据驱动子任务学习和子任务评估,实现与长期规划能力、符号知识以及直接从高维感官输入进行端到端强化学习的优点相结合,并在实验结果中证实了子任务可解释性与与现有技术相比的数据效率改进。