Aug, 2022

广义强化学习:经验粒子、动作算子、强化场、记忆关联和决策概念

TL;DR本文通过建立基于贝叶斯框架的泛化强化学习框架,引入参数动作模型和加强型场的概念,在 RL 策略搜索中追加高级决策概念,并使用加强型场作为补助带有度量的元记忆库,以建立和增强学习代理的演化世界模型。