Sep, 2022

自适应网格细化的深度强化学习

TL;DR本文提出了一种基于部分观测马尔可夫决策过程的自适应网格细化方法,并采用深度强化学习训练策略网络,以求取高效精确的数值模拟结果。