Jun, 2012

大型结构化领域中的基于模型的贝叶斯强化学习

TL;DR本文提出一种基于模型的Bayesian强化学习框架,采用因式表示和在线规划技术来提高可扩展性,结合学习动态系统结构和参数,同时制定(近)最优动作序列。