Oct, 2019

使用移动机器人的交互式导航的分层强化学习

TL;DR提出了一种新型的分层强化学习架构 HRL4IN,用于解决包含导航和操作任务的具有异构性的交互式导航任务问题,并且能够提高能源效率。在 2D 网格世界环境和 3D 物理仿真环境中,HRL4IN 相对于平面 PPO 和 HAC 等算法,在任务性能和能源效率方面的表现明显优于其他基线算法。