Dec, 2020

SPOTTER: 通过有针对性的强化学习扩展符号规划操作

TL;DR本文提出了集成框架 SPOTTER,它使用强化学习来增强和支持规划代理,从而发现代理需要实现起初无法达成的目标所需的新运算符。 SPOTTER 在发现可转移的符号知识的同时优于纯 RL 方法并且不需要监督,成功计划跟踪或有关丢失的计划运算符的任何先验知识。