Mar, 2017
用于分层强化学习的封建网络
FeUdal Networks for Hierarchical Reinforcement Learning
Alexander Sasha Vezhnevets, Simon Osindero, Tom Schaul, Nicolas Heess, Max Jaderberg...
TL;DR介绍了一种新的分层强化学习方法,即 FeUdal Networks,该方法采用 “管理者 - 工作者” 框架,在不同的时间分辨率上进行端到端的学习,以完成由管理者设定的抽象目标,并且旨在解决长时间跨度的信用分配问题,并在 ATARI 和 DeepMind Lab 中的任务上取得显著优势。