Jun, 2017

协作多智体学习的价值分解网络

TL;DR利用价值分解网络架构解决合作多智能体强化学习中的观测部分性、虚假奖励和 “懒惰智能体” 问题,并在与共享权重、角色信息和信息通道相结合的情况下,在部分可观测的多智能体领域取得优越结果。