Jun, 2023

多智能体强化学习分解分布式值函数的统一框架

TL;DR提出了一个名为 DFAC 的统一框架,用于将分布式 RL 与值函数分解方法相结合,以对多智能体 RL 问题进行建模和解决。DFAC 能够因子化回报分布,使得它能够在多个基准测试中具有更好的表现。