Jun, 2022

RACA: 基于关系感知的多智能体深度强化学习中的即时合作信用分配

TL;DR本研究提出了一种名为 RACA 的新方法,利用基于图形的关系编码器对代理之间的拓扑结构进行编码,并利用基于注意力机制的观测抽象机制,实现了在测试时间的 ad-hoc 合作场景中的零启动通用化。