TL;DR使用层次混合离线-在线的深度强化学习代理提出了一种解决HRL代理在可视复杂部分可观察3D环境中的问题的方法,并在DeepMind Hard Eight任务中与非分层Muesli基线相竞争,研究揭示了以前未注意到的实际挑战,并为了解复杂领域中的层次代理提供了新的视角。
Abstract
hierarchical reinforcement learning (hrl) agents have the potential to demonstrate appealing capabilities such as planning and exploration with abstraction, transfer, and skill reuse. Recent successes with