Sep, 2016

基于深度强化学习的分散式非通信多智能体避碰

TL;DR该研究提出了一种基于深度强化学习的分散式多智能体碰撞避免算法,该算法利用价值网络来实现高效(即可实时实施)的查询并考虑其他智能体的运动不确定性,与现有碰撞避免策略相比显示出更高的路径质量改进。