Jul, 2023

基于 Kronecker 图的可扩展多代理技能发现

TL;DR通过直接计算多智能体任务的 Laplacian 谱,我们提出一种基于 Kronecker 图的多智能体选项发现方法,通过估计 Fiedler 向量来改善联合状态空间的连通性,并通过深度学习扩展方法来处理无限规模状态空间。在 Mujoco 等模拟器上的多智能体任务评估中,我们的方法成功地识别了多智能体选项,并显著优于现有技术。