Jan, 2011

Dyna-H: 一种应用于角色扮演游戏策略决策系统的启发式计划强化学习算法

TL;DR本论文提出了一种基于启发式规划策略的路径规划方法,该方法在模型自由的在线强化学习中比传统的单步 Q 学习和 Dyna-Q 算法都表现出色,可以用于角色扮演游戏中的最优轨迹规划。