Oct, 2023

层次强化学习用于时间模式预测

TL;DR我们探索了使用分层强化学习(HRL)来预测时间序列的任务。结合深度学习和分层强化学习的方法,我们开发了一个股票智能体来预测历史股价数据的时间序列,以及一个车辆智能体来预测第一人称车载摄像头图像中的转向角。我们在两个领域的结果表明,称为封建式强化学习的一种HRL方法,在训练速度、稳定性和预测准确性方面都有显著的改进。其中的关键因素是多分辨率结构,将时间和空间抽象引入了网络层次结构。