Jul, 2019

基于变分推理的贝叶斯模型强化学习动态规划

TL;DR该研究提出了一种基于贝叶斯推理的模型强化学习方法,通过引入不确定性建模,可以更好地优化学习表现,并在多个机器人运动任务上得到了验证。