Sep, 2023

具有强化学习的加速课程的众包感知多智能体路径规划

TL;DR采用强化学习和增强型课程化训练策略指导,引入 CRAMP(一种人群感知的去中心化方法),从而克服了多智能体路径规划在拥挤环境中的性能退化问题。在模拟环境中测试发现,CRAMP 在解决方案质量上比以往的去中心化方法提高了 58%,在成功率方面提高了 5%。