Nov, 2019

IRIS:从脱机机器人操作数据中学习控制的大规模隐式强化学习

TL;DR该论文介绍了一个名为 IRIS 的机器人控制方法,可以从大规模离线演示数据中学习目标导向的低级控制器,并使用高级目标选择机制来结合次优解以更加成功地完成任务。