Jun, 2023

CAMMARL: 多智能体强化学习中的符合性行为建模

TL;DR本文提出了一种基于置信集和符合预测的多智能体强化学习算法 CAMMARL,并通过在两个完全协作的多智能体任务中进行的多个实验证明了该算法可以提高智能体的策略学习能力。