Jan, 2022

使用因子图为基础的表格强化学习中学习多智能体选项

TL;DR本文提出了一种基于 Kronecker 图的多智能体协同探索的选项发现方法,通过鼓励智能体连接相应的最小或最大 Fiedler 向量,构建多智能体共同目标状态,从而在多智能体任务中实现更快的探索和更高的累积奖励。