ICLRSep, 2018

M$^3$RL: 意识感知的多智能体管理强化学习

TL;DR本文提出 Mind-aware Multi-agent Management Reinforcement Learning (M^3RL) 算法,通过对多个自我意识且不可控制的机器人进行建模,实现超级机器人的管理和操纵,以实现最优的多机器人协同任务分配和奖励系统。