Sep, 2018

PRIMAL: 通过强化学习和模仿多智能体学习进行路径规划

TL;DR该研究提出了 PRIMAL,一种新的多智能体路径规划框架,结合了强化学习和模仿学习,用于训练全分散策略,在部分可观测的环境中在线反应式规划路径,具有隐式协调性。该框架通过引入专家规划器的演示,细心的奖励重新塑造和环境抽样,扩展了以前我们在协作策略的分布式学习方面的工作。最终,该研究还在模拟机器人实验中验证了所学策略的性能。