Jul, 2014

基于核的强化学习实践

TL;DR本文介绍了一种将KBRL转化为实用强化学习工具的算法:基于核的随机分解(KBSF)。KBSF利用一种简单的思路将KBRL模型中的信息压缩为固定大小的模型,从而实现线性的计算时间复杂度并且可以在离线和在线环境中应用于大规模问题。