Dec, 2020

迈向持续强化学习:综述与展望

TL;DR本文综述了关于非不变 RL(Lifelong 或非平稳 RL)的不同公式和方法的文献,提出了连续 RL 公式的分类法,并提供了连续 RL 方法的分类。此外,我们讨论了评估连续 RL 代理的重要度量和开放性问题,并强调了这方面的研究前景。