Dec, 2023

情景依赖的因果影响基础下的合作多智能体强化学习

TL;DR提出了一种名为 Situation-Dependent Causal Influence-Based Cooperative Multi-agent Reinforcement Learning (SCIC) 的新型多智能体强化学习算法,通过基于因果关系干预和条件互信息,探测特定情况下智能体间的因果影响,从而促进智能体之间的合作。实验结果表明与其他算法相比,该方法优于目前最先进的方法。