Dec, 2022

系统辨识中的强化学习

TL;DR该论文探讨了在强化学习领域中,如何通过学习前向模型(也称转移函数、系统动力学)来近似马尔可夫决策过程中状态转移函数的过程,并提出了利用强化学习技术解决复杂动态系统学习问题的实验结果