Mar, 2024

对抗多智能体游戏中的扩散 - 强化学习层次化运动规划

TL;DR基于强化学习的运动规划在自主导航到机器人操控等方面已显示出超越传统方法的潜力。本文针对部分可观察多智能体对抗潜逃游戏(PEG)中规划机动任务展开研究。我们提出了一种分层架构,将高层扩散模型与低层强化学习算法结合,分别用于全局路径规划和回避行为推理。该方法通过利用扩散模型引导强化学习算法进行更高效的探索,并提高了可解释性和预测能力,相较于基准模型的表现提高了 51.2%。