May, 2019

四足动物运动的分层强化学习

TL;DR本文介绍一种利用层次化框架实现四足机器人路径跟踪任务的方法,其中高层策略以潜在空间向低层策略发出指令,并控制其执行的时间,低层策略使用潜在指令和机器人传感器来控制机器人的执行器,以完成任务需求,同时可以实现训练后的低层策略的高效迁移,为实现端到端的层次化深度学习提供了理论支持。