Feb, 2019

Message-Dropout: 多智能体深度强化学习的高效训练方法

TL;DR本文提出了一种名为消息随机删除的新学习技术,以提高多智能体深度强化学习的性能,并针对两种应用场景进行了改进:1)在智能体之间允许直接消息通信的经典多智能体强化学习和2)集中训练与分散执行。该技术可有效处理多智能体强化学习中的输入维度,接收和发送之间的通信错误,并显著提高了强化学习的培训速度和稳态性能。