May, 2018

深度强化学习中动态决策机构的运动规划

TL;DR本文介绍了一种基于深度强化学习和 LSTM 的算法,可以在不使用特定行为规则的情况下,学习各种类型的动态代理之间的避碰。通过仿真和在全自主机器人车辆上的实验,证明了该算法随着代理数量的增加能够更好地执行避碰,并且不需要使用 3D 激光雷达。