Apr, 2017

多导师强化学习

TL;DR通过分布式学习将单智能体 RL 问题分配给多个学习者,并使用本地化规划策略,引入了一种新的基于共情策略的解决方案,并在实验中验证了其在果实收集任务上的效果。