Jul, 2023

控制作为概率推理:多智能体强化学习中的一种新型沟通机制

TL;DR本文提出一种生成概率模型,该模型融合了新兴的通信和多智能体强化学习技术,可通过概率推断计划其动作,在通过信息传递实现协作任务的过程中,使用潜在变量估计与规划,基于 Metropolis-Hasting 命名游戏公式推算,实现了有意义的信息传递和协作任务。