May, 2019

逆强化学习交互式教学算法

TL;DR本研究探究了带有教师辅助的反向强化学习问题,提出了一种交互式教学框架,设计了两种具体教学算法:全知教学和黑盒教学,最后在汽车驾驶仿真环境中进行了实验并证明了教学算法的效果。