IJCAIApr, 2018

PEORL: 集成符号化规划与层次化强化学习用于鲁棒性决策

TL;DR本文介绍了一种统一框架 PEORL,将符号计划与分层强化学习相结合,以应对不确定的动态环境下的决策制定,通过符号计划指导智能体的任务执行和学习,学到的经验则反馈给符号知识以改进计划,可在复杂领域产生快速的策略搜索和稳健的符号计划。