Jul, 2010

AIXI近似强化学习

TL;DR本文介绍了一种可扩展的通用增强学习代理的设计方法,该方法基于对AIXI的直接逼近,利用Monte Carlo Tree Search算法和Context Tree Weighting算法的代理特定扩展得以实现,实验表明该算法在多个随机、未知和部分可观察的领域中表现良好。