Oct, 2020

超越Tabula-Rasa: 一种用于物理嵌入式3D Sokoban的模块化强化学习方法

TL;DR该论文探讨了将模块化 RL 方法应用于 Mujoban 任务的可行性,并证明了模块化 RL 方法比仅有一个单一 RL 代理的方法更加优越。