ICLRApr, 2020

尝试时重来,而不是尝试更久:自适应课程学习的先验学习

TL;DR该研究论文提出了一种两阶段自适应教学方法,以提高深度强化学习(DRL)智能体的性能,主要包括使用过程生成任务、自动课程学习(ACL)和探索课程等关键词。