IJCAISep, 2019

利用人类指导提升深度强化学习任务

TL;DR本文综述了五个最近的学习框架,这些框架主要依赖人类指导,而不是传统的一步一步的动作演示,评估了每个框架的动机、假设和实现,并讨论了可能的未来研究方向。