Jun, 2012

使用乐观本地转换的近乎最优 BRL

TL;DR介绍了一种基于模型的贝叶斯强化学习(BRL)算法BOLT,并分析了其样本复杂度,展示了该算法与以往方法的区别及其优越性。