Jun, 2019

多智能体强化学习中的行为层次结构建立

TL;DR本文研究了多智能体游戏中的泛化问题,提出一种基于博弈论结构的分层代理架构以提高策略推广能力。该方法可以跨层次地进行信用分配,实验结果表明,与传统基线方法相比,分层代理的泛化能力更强。