ICMLAug, 2023

有限观测多智体强化学习与(准)效率:信息共享的福音

TL;DR我们研究了部分可观察随机博弈的可证明多智能体强化学习 (MARL)。我们主张利用智能体之间的信息共享,在可观察性假设的情况下构建一个近似模型来规划近似均衡,并开发了一种具有统计和计算上拟效率的部分可观察 MARL 算法。