Feb, 2024

去中心化多 Agent 协同探索中的新颖性共享

TL;DR提出一种名为MACE的简单而有效的多智能体协同探索方法,通过仅传递本地新奇性,代理可以考虑其他代理的本地新奇性来近似全局新奇性,并引入加权互信息来衡量代理行为对其他代理累积新奇性的影响,在后见中将其转换为内在奖励,以鼓励代理对其他代理的探索产生更多影响并促进协同探索,并在三个稀疏奖励的多智能体环境中展示了MACE在性能上的优越性。