Jul, 2022

多智能体强化学习的交互模式分离

TL;DR本文提出了一种基于互动原型分离(OPT)的多智能体学习方法,将联合值函数分解为代理值函数以及实体交互成原型,以过滤掉無关實體之間的噪音交互,从而显着提高泛化能力和可解释性,并在单任务和多任务基准测试中获得了优于现有技术的结果。