MMSep, 2023

深度多智能体强化学习在去中心化主动假设测试中的应用

TL;DR我们提出了一种基于深度多智能体强化学习框架的算法,名为 MARLA,用于多智能体主动假设检验问题,通过将每个智能体的状态映射到行动,从而最小化贝叶斯风险。我们通过实验结果有效展示了智能体学习协作策略和通过 MARLA 提升性能的能力,并展示了 MARLA 在单个智能体学习方法上的优越性。最后,我们提供了 MARLA 框架的开源实现,以方便相关领域的研究人员和开发者。