Oct, 2017

PRM-RL: 结合强化学习与采样规划的长程机器人导航任务

TL;DRPRM-RL 是一种利用采样路径规划结合强化学习实现远程导航的分层方法,其中 RL 代理通过学习短距离点到点导航策略,采用面向特征和深度神经网络及 PRMs 进行构建,并通过采样计划器提供的规划路径实现机器人的控制。PRM-RL 的应用结果表明,在室内和城市环境下,比起单独使用 RL 代理或传统的采样路径规划方法,PRM-RL 实现了任务完成度的显著提升,在噪声传感器条件下成功完成长达 215 米的轨迹,且实现了对 1,000 米长的空中货运的无违约任务达成。