ICMLMar, 2013

ABC 强化学习

TL;DR该论文介绍了一个基于 ABC 的简单通用框架,用于无似然贝叶斯强化学习,该算法主要利用先验分布,能够应用在基于详细模拟模型的领域,试验结果证实了该算法在 LSPI 比较中具有潜在优势,并引入了一个定理,证明了该算法是原则上可行的。