Jun, 2021

深度强化学习的马尔可夫状态抽象学习

TL;DR该研究提出了一种学习马尔科夫状态抽象表示的新方法,结合逆向模型估计和时态对比学习,可以提高强化学习中的样本效率。