Jun, 2019

多智能体团队中可迁移合作行为的学习

TL;DR提出使用共享的代理-实体图来建模多智能体相互作用,并利用基于图的强化学习训练代理实现协作行为,实现了对多种任务的有效解决,并展示了其泛化能力。