May, 2023

潜在互动 A2C 用于开放多智能体系统中改进强化学习

TL;DR本文介绍了一种基于编码器 - 解码器结构的潜在 IA2C 方法,其利用去中心化的训练和执行,学习隐藏状态和其他代理的动作的潜在表示,实验结果表明,潜在 IA2C 显著提高了样本效率,并在具有开放代理人口的时间上进行了评估。