Apr, 2023

封建图强化学习

TL;DR使用封建式的强化学习方法,通过分层的图表示来控制具有不同结构的物理代理,并在基准环境中证明框架的概念及其在标准基准和零点转移学习设置方面的良好结果。