Jun, 2022

递归强化学习

TL;DR研究递归在强化学习中的应用,提出一种递归马尔可夫决策过程和概率下推系统的等价表示方法,结合 Recursive Q-learning 算法,用于解决这一问题。