Mar, 2017

用于分层强化学习的封建网络

TL;DR介绍了一种新的分层强化学习方法,即 FeUdal Networks,该方法采用 “管理者 - 工作者” 框架,在不同的时间分辨率上进行端到端的学习,以完成由管理者设定的抽象目标,并且旨在解决长时间跨度的信用分配问题,并在 ATARI 和 DeepMind Lab 中的任务上取得显著优势。