Jun, 2023

结合启发式和多智体强化学习的多机器人路径规划

TL;DR提出了一种结合启发式搜索、经验法则和多智能体强化学习的路径规划方法 MAPPOHR,将启发式搜索用于生成全局路径,用经验法则和奖励函数激励实时规划器,用多智能体强化学习算法实现实时规划,实验证明该方法比传统学习和启发式方法的规划性能更好且学习效率更高。