Sep, 2022

基于宏动作的部分可观测性多智能体/机器人深度强化学习

TL;DR本文提出了一种基于宏操作(macro-actions)的多智能体强化学习方法,该方法支持异步学习和决策制定,在多智能体/机器人领域具有广泛应用价值。本文的算法在多个领域的仿真实验和现实机器人实验中验证了其有效性和高质量解决方案的能力。