BriefGPT.xyz
Jul, 2020
协作多智体强化学习的奖励机器
Reward Machines for Cooperative Multi-Agent Reinforcement Learning
HTML
PDF
Cyrus Neary, Zhe Xu, Bo Wu, Ufuk Topcu
TL;DR
研究团队提出使用奖励机器(RM)对协作多智能体强化学习中的团队任务进行编码,分解任务成子任务分配给个体智能体去完成,提出一种分布式完成子任务的算法,提供了一种自然去中心化学习的方法,并在实验中验证了所提出的方法非常有效。
Abstract
In
cooperative multi-agent reinforcement learning
, a collection of agents learns to interact in a shared environment to achieve a common goal. We propose the use of
reward machines
(RM) -- Mealy machines used as
→